Elasticsearch 6.4 기본 한글 형태소 분석기 노리 (nori) 설명 및 사전 추가하기

엘라스틱 서치를 쓰면서 기존에 형태소 분석기를 아리랑, 은전한닢, open korea등을 사용했었다. 근데 이번에 6.4버전이 출시 되면서 Elasticsearch에서 기본으로 제공하는 한글 형태소 분석기가 나왔다. 이름은 nori(노리)이다. 노리는 놀이라는 뜻에서 가져왔으며 mecab-ko-dic 사전을 이용하지만 사전을 압축하므로 기존 형태소 분석기와 비교하여 메모리를 적게 쓰고 훨씬 빠르다. 그럼 Docker에 엘라스틱서치 6.4와 Kibana 6.4를 설치하고 Nori 플러그인을 설치해서 한글 형태소분석기를 사용해보자. Docker에 Elasticsearch와 Kibana 설치12docker run -d -p 9200:9200 -p 9300:9300 --name elastic -e "discov..

→2018.10.13

Book Review

빅데이터의 다음 단계는 예측분석이다.

http://book.naver.com/bookdb/book_detail.php?bid=8377266 빅데이터의 다음 단계는 예측 분석이다국내도서저자 : 에릭 시겔(Eric Sigel) / 고한석역출판 : 이지스퍼블리싱 2014.11.26상세보기 회사에 책꽂이에 있던 책중에 어떤책을 읽을까 고민하다가, 데이터분석을 복수전공하면서 읽어보려다가 읽지 못한 "빅데이터의 다음단계는 예측분석이다"라는 책을 골랐다. 책의 내용은 다양한 시행착오를 통해서 예측분석을 성공시킨 사례들과 어떤 원리로 예측분석을 진행하는 것이 좋은지 소개하고 있다. 간단하게 내가 본 내용을 정리했다. 예측 분석을 위해서는 먼저 무엇을 예측하려고 하는지 고르고 무엇을 얻고자 하는지 목표를 정확히 세워야 한다. 그 다음 주어진 데이터를 이..

→2018.05.27

Elasticsearch 6.4 기본 한글 형태소 분석기 노리 (nori) 설명 및 사전 추가하기

빅데이터의 다음 단계는 예측분석이다.

티스토리툴바