Skip to content

Commit

Permalink
Merge pull request #66 from twitter/proper_nouns
Browse files Browse the repository at this point in the history
Added ProperNoun
  • Loading branch information
hohyon-ryu committed May 5, 2015
2 parents 2aab10a + e3d7b85 commit 4936259
Show file tree
Hide file tree
Showing 25 changed files with 7,661 additions and 8,631 deletions.
4 changes: 2 additions & 2 deletions pom.xml
Original file line number Diff line number Diff line change
Expand Up @@ -21,7 +21,7 @@
<groupId>com.twitter.penguin</groupId>
<artifactId>korean-text</artifactId>
<packaging>jar</packaging>
<version>4.0.2-SNAPSHOT</version>
<version>4.1-SNAPSHOT</version>
<name>Korean Text Processing Utilities</name>
<url>https://github.com/twitter/twitter-korean-text</url>
<description>Scala library to process Korean text</description>
Expand All @@ -39,7 +39,7 @@
<connection>scm:git:https://github.com/twitter/twitter-korean-text.git</connection>
<developerConnection>scm:git:[email protected]:twitter/twitter-korean-text.git
</developerConnection>
<tag>korean-text-4.0.1</tag>
<tag>korean-text-4.1</tag>
</scm>
<prerequisites>
<maven>3.0.4</maven>
Expand Down
4 changes: 3 additions & 1 deletion src/main/java/com/twitter/penguin/korean/KoreanPosJava.java
Original file line number Diff line number Diff line change
Expand Up @@ -34,5 +34,7 @@ public enum KoreanPosJava {
Email, URL, CashTag,

// Functional POS
Space, Others;
Space, Others,

ProperNoun;
}
Original file line number Diff line number Diff line change
Expand Up @@ -97,7 +97,9 @@
넉넉하
노랗
놀라
놀랍
놀래
눈부시
느리
Expand Down
Original file line number Diff line number Diff line change
@@ -1,44 +1,22 @@
가스
가이오
게임파크
경동
고속
공사
공항
광고
광동
광주카
교보
교육
교통
구글
국민
귀뚜라미보일러
그라비티
금복주
금융
금호
금호아시아나
기아
기업
남해
네이버
넥센
넥슨
농심
농협
다음
다음카카오
대구텍
대림
대웅
대원
대한
도로
동국
동부
동서
동아
두루넷
두산
디스플레이
Expand All @@ -51,19 +29,12 @@
르노
메가박스
모나미
모드
모자
무림
무학
문화
뮌헨
미디어다음
미래에셋
미샤
미스터피자
반도
방송
백양
베이
벡셀
보광
Expand All @@ -72,13 +43,10 @@
부산
비씨
빅히트
빙그레
산업
산전
삼성
삼양
삼익
삼천리
삼화
생명보험
설빙
Expand All @@ -87,25 +55,18 @@
스킨푸드
스탠다드차타드
스파
시멘트
시스템
시스템스
식품
신세계
신한
신화철강
싸이월드
쌍용
씨아이
아모레퍼시픽
아사달
아시아
아시아나
아이리버
아이코닉스
아주
아진산업
악기
안다미로
안랩
야후
Expand All @@ -122,59 +83,35 @@
엠코
영안
영어교실
영창
오뚜기
오리온
오위즈
오일
오콘
외환
우관
우리
웅진
윕스
유진
유한양행
윤선생
은행
이랜드
이마트
이브자리
이수
이스트
이스트소프트
인도양
인디자인
인스타
인스타그램
인크룩스
인터넷
일동제약
일렉트로닉
일보
잉카
자동차
자전거
재미나
전력
전자
제강
제과
제과식품
제약
제주
제철
조선
중공업
중앙
진로
진우
진흥
차타드
천재교육
철도
침대
카드
카스
캐리비안
커뮤니케이션스
Expand All @@ -185,13 +122,10 @@
코원
쿠쿠
큐브
크라운
크리에이션
키스웰
타이어
태광
테크론
통일
투어
티웨이
판타그램
Expand All @@ -205,23 +139,16 @@
프라우나
프로스펙스
프로토
하나
하이트
한국
한글과컴퓨터
한라
한솔
한진
한컴
한화
핫트랙스
항공
해태
현대
홀딩스
홈플러스
화학
효성
휘닉스
휠라
휴맥스
Expand Down
Original file line number Diff line number Diff line change
Expand Up @@ -91,7 +91,6 @@
강별
강병규
강병현
강산
강성구
강성모
강성연
Expand Down
Original file line number Diff line number Diff line change
Expand Up @@ -231,6 +231,7 @@
멘탈
멘트
멜론스밍
모게코엘
모노
모닝콜
모던
Expand Down Expand Up @@ -349,7 +350,6 @@
세이지
세일러문
세토
세훈
센죠가하라
셀렉
Expand Down Expand Up @@ -398,6 +398,7 @@
시디즈
시라이
시로
시리어스
시린메드
시모노
시미즈
Expand Down Expand Up @@ -539,6 +540,7 @@
와타시와
왕하
요나가
요스케요스케이
요시
요시다
우라하라
Expand Down Expand Up @@ -606,6 +608,7 @@
인슾
인터라켄
인텔리전트
인포
일러레
일러스트레이터
일렉트로니카
Expand Down Expand Up @@ -734,6 +737,7 @@
쿠나기사
쿠다사이
쿠다사잇
쿠로다
쿠로사와
쿠로오
쿠로칭
Expand All @@ -748,11 +752,30 @@
퀸에이리언
큐션
큐티하니
크라운
크래커
크랭크
크러쉬네이터
크럼핑
크레디크카드
크레용
크레인
크레졸
크레파스
크로스미라쥬
크로켓
크로키
크롬
크루
크리스마스
크리스마스실
크리스마스이브
크리스마스카드
크리스마스캐럴
크리스천
크리스털
크리스털글라스
크림
클레르
클레어
클리어
Expand Down Expand Up @@ -934,6 +957,7 @@
핼로
햄스터
허니
허니버터칩
헤이노
헤이로
헤일로
Expand Down
Loading

0 comments on commit 4936259

Please sign in to comment.