목록전체 글 (48)
think deeply
1. LINER는 콜드 스타트 문제를 어떻게 해결했을까? 📌 포인트 사용자 선호 정보 입력 유도 선호 정보 기반 추천 어느 서비스를 처음 사용할 때 가입 과정에서 사용자가 어떤 주제에 관심을 가지는 지 선택한 경험이 있을 거에요. 신규 가입 사용자에게 가입 과정 중 ‘관심사’ 등 사용자 선호 정보 입력하도록 유도하여 선호 정보를 추천 시드로 활용하는 방법이에요. 2. 트렌드에 사용자의 관심사 반영 📌 포인트 트렌딩 스코어 정의 트렌드 기반 추천 실시간으로 적재되는 하이라이트 데이터를 활용해 현재 라이너를 사용하는 다른 사용자들은 어떤 글에 하이라이트하고 있는지 등의 인사이트가 녹아든 추천 경험을 제공하고자 했습니다. 이를 라이너는 ‘하이라이트 인터랙션 기반 트렌딩 콘텐츠 추천’라고 정의했어요. 단순 최신..
📌 포인트: 연관 스타일끼리 K-means 클러스터링 1. 트렌드 기반 콘텐츠만 제공해도 될까 아래를 보시면, 스타일쉐어의 홈 화면에서 제공되는 컨텐츠 대부분이 유저 대상 타켓딩이 되지 않고, 트렌드에 초점을 맞춘 컨텐츠임을 알 수 있어요. 사용자를 위해서는 개인의 취향 또한 기업이 잡아야할 토끼라고 생각합니다. 앞선 사례에서 다룬 연관스타일에서 새로운 아이디어를 착안했어요. 2. 유저들의 관심사 별로 묶인 스타일 그룹을 만들자! 앞서 유저의 관심사를 가장 주요한 지표로 보고 스타일을 추천해준 사례를 소개해드렸어요. 관심사의 묶음이 스타일을 탐색하는 새로운 경험이 될 것이라 생각했기에, 다음과 과정을 진행했습니다. 유저들의 관심사 별로 묶인 스타일 그룹 연관 스타일에서 스타일을 추천하기 위해 만든 모델에..
📌 포인트 : 가장 주요한 지표를 ‘관심사’로 봄! 관심사는 행동기록 데이터를 활용 스타일쉐어는 패션 정보에 특화된 인스타그램이라고 할 수 있는데요. 인스타그램처럼 마음에 드는 코디에 좋아요를 누르거나, 마음에 드는 사용자를 팔로우하거나 마음에 드는 코디를 자기 페이지에 스크랩하는 기능 등을 가지고 있어요. 2021년 무신사에 통합되어 2022년 서비스 중단했지만요. 1. 사용자가 좋아할 스타일을 어떻게 정의할까 스타일쉐어의 고민은 여기 있었습니다. 저희가 현재 쓰고 있는 인스타그램처럼 사용자가 좋아할 컨텐츠(패션 스타일)를 업로드해주어야 했어요. 그럼 사용자에게 스타일사용자가 좋아할 스타일을 어떻게 정의할 것인가 고민하는 과정이 존재했습니다. 그럼 어떤 스타일을 연관있는 스타일로 사용자에게 제공해야할까..
Automatic merge failed; fix conflicts and then commit the result. 이런 에러가 발생했을때, 해결방법은 2가지 !! 방법 1. 코드 수정하기 1) 충돌이 발생하는 부분을 제거 혹은 수정해주기 ( >>> ===
melt 함수 기본틀: pandas.melt(frame, id_vars=None, value_vars=None, var_name=None, value_name='value', col_level=None) - frame: 변환할 데이터프레임 - id_vars: 유지할 열의 이름, 즉 변환하지 않을 열들의 이름을 나타내는 리스트 - value_vars: 변환할 열들의 이름을 나타내는 리스트. 만약 value_vars가 None으로 설정되면, id_vars를 제외한 모든 열이 변환 대상 - var_name: value_vars로 지정한 열의 이름을 설정. 기본값은 'variable'. - value_name: 변환된 데이터프레임에서 value(내용)이 되는 열의 이름을 설정. 기본값은 'value'. - co..
앙상블 학습(ensemble leaning) 앙상블 알고리즘은 학습 방식에 따라 보팅, 배깅, 부스팅, 스태킹으로 나뉜다. 보팅 voting 여러 개의 분류기가 투표를 통해 최종 예측 결과를 결정하는 방법 보팅은 크게 하드 보팅과 소프트 보팅으로 나뉨 하드 보팅 : 다수결 투표라고 볼 수 있음 최종 예측을 각 개별 모델이 예측한 것 중 가장 많은 모델에서 예측되는 클래스 레이블로 함 소프트 보팅: 앙상블의 각 개별 모델이 주어진 입력에 대해 클래스에 대한 확률 분포를 에측하는 투표 유형 최종 예측은 모든 모델에서 평균 확률이 가장 높은 클래스 레이블로 함 배깅 bagging 주어진 데이터셋을 랜덤 샘플링하여 새로운 데이터셋을 만들어내는 것을 의미. 샘플을 여러 번 봅아 각 모델을 학습 시켜 결과물을 집계..
RSS (Rich Site Summary)의 줄임말 뉴스나 블로그같이 컨텐츠가 자주 업데이트가 되는 사이트들이 업데이트된 정보를 사용자들에게 보다 쉽고 빠르게 제공하기 위해 만들어진 포맷 XML 기반으로 되어 있으며 간단하게 제목, 내용, 날짜 등 배포에 필요한 최소한의 정보를 통해 쉽게 작성할 수 있도록 구성되어 있음
개념 특정 태스크를 학습한 모델을 다른 태스크 수행에 재사용 하는 기법. 쉽게, 한 분야의 문제를 해결하기 위해서 얻은 지식과 정보를 다른 문제를 푸는데 사용하는 방식을 의미한다. 아무 지식없이 처음부터 학습하는 것보다 익힌 것을 활용한다면 학습 속도가 더 빠른 것과 같다. 예시 자연어에서 예로 들기엔 설명이 복잡하여 하나의 포스팅으로 빼고 링크를 걸어두겠다. https://brunch.co.kr/@geumjaelee/4 자연어의 피처와 전처리 Feature and Preprocessing for NLP | 1. 오늘의 주제 * 왜 한국어의 자연어처리가 어려운가? * 왜 자연어처리의 개념을 잡기가 어려운가? * Feature와 Label, Data는 무슨 관계인가? * Feature란 무엇인가? * 자 ..