목록분류 전체보기 (48)
think deeply
window 쓰던 사람들은 화면 분할 단축키에 익숙하다. 맥북도 화면 분할 방법이 존재하나, 다음 그림과 같이 찾아보지 않는 이상은 알기 어렵다. 반면, 그 화면 분할 단축키가 맥북은 초기값으로 지니고 있지 않는다. 아래에 맥북에 화면 분할 단축키 설정을 하는 spactacle 어플리케이션을 설정하는 방법을 정리해둔 사이트를 가지고 왔다. https://extrememanual.net/41717 Mac 화면 분할 단축키 사용 방법 - 익스트림 매뉴얼 Mac 컴퓨터에서 작업을 하면서 동시에 여러개의 창을 띄워야 할 때 화면 분할 기능을 이용해 화면을 효율적으로 사용할 수 있는 기능을 제공하고 있습니다. macOS의 화면 분할 기능은 창 왼쪽의 전 extrememanual.net
텍스트 마이닝 세미나 중 교수님께서 좋은 시각화 예시로 '썸트렌드' 홈페이지를 예시로 보여주셨다. 썸트렌드는 바이브컴퍼니의 비즈니스 중 하나다. 바이브컴퍼니의 부사장이 송길영 박사님이라고 자주 들어봤지 않냐 물으셨다. 알파고가 등장했을 무렵, 처음 세바시같은 강연에 송길영 박사께서 자주 등장해서, 그리고 그 개성있는 비주얼(긴 생머리)덕에 더욱 뇌리에 꽂혀있는 성함이었다. 시각화의 중요성을 느끼고 있던 터라, 바이브컴퍼니가 구현한 시각화가 너무나 깔끔해 경이로울 정도였다. 복잡하고 난해한 온라인 속의 소비자 데이터를 이토록 직관적이고 편리하게 기업이 활용할 수 있도록 전환하다니. 그 송길영 박사님에 대한 궁금증에 비교적 최근에 발간한 도서를 찾아보았다. '그냥 하지 말라.' 지금까지 농업적 근면성으로 열..
EDA(Exploratory Data Analysis, 탐색적 데이터 분석) 분석을 하기 위한 데이터를 살펴보는 과정을 의미하는 단어 도출하고자 하는 결과값을 좀 더 수월하게 낼 수 있도록 해당 데이터를 살펴보는 것입니다. EDA가 필요한 이유 분석 코드를 어렵게 모두 작성해도 원하는 형태의 결과가 나오지 않을 수 있는데, 그럴 경우 그 시간이 모두 헛고생으로 돌아간다. 근원적으로 분석해야하는 데이터를 잘못 이해했기 때문이라고 볼 수 있다. 오늘은 현재 내가 분석하고자 하는 대상인 '국내 e-book에 대한 사용자 경험 분석' EDA 과정을 간략히 정리해두고자 작성한다. 1. 관련 raw data를 모으기 위해, 국내 구글 플레이 스토어 크롤링 진행 분석 대상에 대한 사용자 경험을 다루기 위해 적합한 데..
이 책을 처음 접하게 된 것은 몇 일전 자기 전에 읽을 전자책을 서칭하다가 알게 된 책이다. 우연히 집어 목차를 보았는데, 공부 방향성에 있어 고민이 많던 나에게 필요해보였다. 다음 날, 운동할 때 e-book으로 청취하면 들었고, 오늘 아침에서야 완독한 도서다. e-book중심으로 읽어 메모해둔 도서의 페이지가 종이책에서 몇 페이지인지는 매칭하지 못했다. ' part 1, 2 '는 인공지능에 대한 지식이 거의 전무한 비전공자들이 읽어볼 만한 부분인 것 같다. 비전공자들이 접하기 어려운 수리통계적인 부분이나 초기 공부법에 대한 해법을 알려준다. 우리가 흔히 데이터 공부를 하고자할 때 가장 접하기 쉬운 학원이나 국비 교육에 대한 부정적 시각을 담고 있다. 내가 그런 국비 교육들을 찾아본 보았을 때도 그랬다..
워드임베딩이란? 사람의 언어를 벡터로 표현하는 방법으로 단어를 희소 벡터가 아닌, 밀집벡터의 형태로 표현하는 것 의미적으로 유사한 단어들끼리 서로 가까이 위치하도록 단어들을 벡터 공간으로 매핑 워드임베딩이 왜 필요한가? 사람의 언어는 불연속적인 형태의 단어로 이루어진다. 각 단어가 갖는 의미가 서로 연관성이 있는 경우도 있지만, 형태가 다른 경우에는 서로 얼마나 연관성이 있는지 컴퓨터는 이해하고 파악하기 어렵다. 그렇기에 단어를 숫자로 표현하는 방식에 따라 자연어 처리의 성능이 크게 달라지기 때문에 단어를 숫자로 바꾸는 과정이 중요하다. 희소 표현 vs 밀집 표현 ※ 희소표현(sparse representation): 벡터 또는 행렬(matrix)의 값이 대부분 0으로 표현되는방법 예로 원-핫 벡터를 생..
내가 관심있는 앱의 리뷰 데이터를 수집할 수 있는 크롤러입니다. 저는 지난 논문에 활용한 데이터도 이와 동일한 방법으로 크롤링했으며, 이번 개인 프로젝트를 위해 e-book과 관련된 어플들 몇 가지를 크롤링하기 위해 크롤링을 진행하였습니다. 셀레니움을 이용한 코드는 저희가 고려해야할 것들이 존재하나, 해당 크롤러는 빠른 속도와 간편한 크롤링이 가능합니다. 궁금한 앱의 웹 주소만 기입하면 크롤링 가능하도록 설명드리겠습니다. 1. 작업환경 저는 우선 Python 프로그래밍 언어에 사용되는 통합 개발 환경인 pycharm을 활용해 크롤링을 진행하였습니다. pycharm은 아래 링크를 참고해 설치하면 됩니다. https://blog.dalso.org/language/python/13524 python 개발을 위..
초록 유형 ▶ 서술형 초록(Descriptive abstract): 100-200 단어; 논문의 목적 및 방법 설명하지만 결과와 결론은 생략 → 짧은 논문과 글에 적합 ▶ 정보형 초록(Informative abstract): 한 문단에서 1 페이지; 결과를 포함하여 연구의 모든 내용을 요약하는 연구 요약문 → 저널 및 컨퍼런스 제출용, 전문적인 연구에 적용되며 더 많이 사용됨 아웃라인 및 초록 작성 ▶ 관련성이 높고 유용한 정보만 제공 → 독자를 혼동시킬 모호한 구절 포함x ▶ 독자를 많이 확보하기 위해 키워드 사용 → 초록에서 다루어진 중요한 단어를 5-10개 정도 추려서 추가해주기 (abstract 마지막에 'keyword'하고 한줄로 작성) 초록 내용 순서 서술형 초록(100-200 단어) ▶ 배경..
순전히 드로우앤드류가 극찬하는 게리 바이너척이 궁금해서 읽어본 책이다. 그 무렵 유투브 알고리즘에 걸려들어 보게 된 만족스러웠던 영상도 한몫했다. 서두에 말해두자면 나는 굉장히 만족스러웠던 도서라 인스타그램도 바로 팔로우했다. 조던 피터슨의 책 '12가지 인생의 법칙'과 유사한 느낌을 주는 책이다. 더 나았던 점이라면 여느 자기계발서와 다르게 part2에서 실사례 기반으로 마인드셋을 설명해주는데, 굉장히 와닿는 사례들이다. 특히, 직장인이라면 더욱 와닿을 것 ! 같움! [1] 바른 피드백의 중요성이다. 굉장히 공감하는 대목이다. 친한 친구들한테는 되도록 솔직한 피드백을 하는데, 나도 절친하지 않은 사람들에게 솔직하기 어렵다. 아니, 그걸 친절히 말하기가 어려운 거겠지. 이 대목에서 얼마전 만났던 존경하는..