Skip to content

기능 설명

Chan-Yub Park edited this page Nov 18, 2016 · 4 revisions

D2H4 v0.0.1 기능 설명

a-z 순입니다.


getComment

인증과정이 있어 개발중입니다.

getContent

getContent(url = url)

다음뉴스 페이지 내에 url, 기사입력시간, 수정시간, 신문사, 제목, 내용 정보를 가져오는 기능입니다. 페이지 구성이 달라 현재 연예와 스포츠 카테고리의 뉴스는 가져올 수 없습니다. breakingnews가 있는 url에서 전체기사 글자 밑에 메인 카테고리를 클릭했을 때, 서브 카테고리가 나오지 않는 메인 카테고리(2016년 11월 18일 기준 연예, 스포츠)는 가져올 수 없다고 이해하시면 됩니다.(각각의 기능개발을 적극 환영합니다. :))

url

Target url을 뜻하며 한개의 다음 뉴스 페이지를 뜻합니다. url에 v.media가 있으면 얼추 맞습니다. 예시: http://v.media.daum.net/v/20161117204003526


getMainCategory

getMainCategory()

다음뉴스의 메인 카테고리를 가져오는 기능입니다. 2016년 11월 18일 기준 사회 / 정치 / 경제 / 국제 / 문화 / 연예 / 스포츠 / IT / 칼럼 / 보도자료가 있습니다.


getMaxPageNum

getMaxPageNum(turl = url)

메인 카테고리의 전체 페이지나 세부 카테고리 페이지에서 마지막 페이지수를 가져옵니다. 한번에 10페이지씩 뛰어넘어 마지막 페이지인지 확인합니다.

turl

Target url 의 줄임말로 다음뉴스 리스트 페이지의 url을 뜻합니다. url에 breakingnews 가 들어 있으면 얼추 맞습니다. 예시: http://media.daum.net/breakingnews/economic


getSubCategory

######getSubCategory(categoryUrl="/society") 다음뉴스의 서브 카테고리를 가져오는 기능입니다. 각 메일 카테고리별로 다양한 서브카테고리가 있습니다.

categoryUrl

다음뉴스에서는 카테고리 url이 각기 반영된 영어단어를 사용합니다. getMainCategory()함수로 생성된 url을 입력으로 사용하시면 되며 한개의 데이터만 입력으로 받고 vector는 받지 않습니다.


getUrlListByCategory

######getUrlListByCategory(turl = url) 메인 카테고리의 전체 페이지나 세부 카테고리 페이지에서 뉴스 페이지의 제목과 url들을 가져옵니다. data.frame(str:news_title, str:news_links)의 결과물을 얻을 수 있습니다.

turl

Target url 의 줄임말로 다음뉴스 리스트 페이지의 url을 뜻합니다. url에 breakingnews 가 들어 있으면 얼추 맞습니다. 예시: http://media.daum.net/breakingnews/economic