Edward's blog
About data science posts
-
TP vs FP / Precision vs Recall 정리
개요 분류모델에서 성능을 평가하는 지표로 AUC, F1-score 등이 사용된다. 그리고 Precision, Recall 등은 이를 계산할때 활용된다. 하지만 이름만 들어서는 어떻게 계산되는지 와닿지않아 매번 사용할때마다 헷갈려서 이렇게 정리를 해두고자 한다. TP, FP, TN, FN T, F T : 예측과 실제 결과가 일치 F : 예측과 실제 결과가 불일치 P, N P...
-
왜 쿠팡은 쿠팡플레이 서비스를 시작했을까?
한때 뉴스사에서 칼럼을 썼던 기억을 바탕으로 쿠팡플레이에 대해 가볍게 글을 쓰고자 한다. 내가 쿠팡플레를 접한 배경 최근 유튜브에 SNL Korea 클립들이 올라오면서 재미있게 시청을 했었다. 나는 당연히 tvn과 같은 tv채널에서 기획한줄 알았는데 알고보니 쿠팡플레이라고 쿠팡에서 운영하는 콘텐츠 플랫폼(?)에서 독점으로 제공을 하는것을 알게되었다. 그래서 쿠팡플레이 사이트에 들어가보니 쿠팡 로켓와우 회원들은 공짜로...
-
[Git] commit 메세지 수정
배경 git은 형상관리, 코드공유 등에 요긴하게 이용된다. git의 핵심은 단연 코드이며 이 외의것은 무시되기 쉽다. 나 또한 commit 메세지라던지, branch 관리 등의 필요성을 크게 못느껴 이를 등한시 했었다. 하지만 협업을 하다보니 이런 부가적인(?) 것들이 왜 필요한지 점차 깨달아가는 것 같다. 이번 포스트는 최근 삼성전자 오픈소스 프로젝트에 참여하며 커밋 메세지 규칙(4단어...
-
[MySQL] SQL서버의 장점 - 왜 csv(Excel file)로 데이터를 관리하지 않을까?
Abstract 데이터에는 다양한 종류가 있다. 옛날에 ADsP를 준비하며 공부했던 기억을 돌이켜보면 데이터를 정형(csv 등), 반정형(xml, json 등), 비정형(이미지 텍스트) 크게 3가지로 분류를 했었던 것 같다. 그중 csv, json 형태의 데이터는 각각 SQL, NoSQL을 이용해 파일이 아닌 서버로 데이터를 관리할 수 있다. 나도 종종 SQL, NoSQL서버를 사용해 데이터 관리를 한 적이...
-
[Django] Rest Framework를 이용해 API 서버 만들기
Abstract 앞선 포스트에서 봤듯이 Django는 Front-end와 Back-end를 한번에 개발할 수 있는 framework이다. 하지만 많은 경우 Django는 서버 개발(Back-end)의 용도로 많이 사용된다. Front-end는 React, Vue등 보다 효율적으로 개발할 수 있는 JS기반 framework가 많기 때문이다. 대표적인 예시로 Django를 이용해 Single Page Application(SPA)를 만드는 것은 매우 비효율적일 것이다. 그래서 이번 포스트에서는 Django의 Rest...