트위터 데이터 다운로드

지난 10 년 동안 트위터는 매우 인기있는 소셜 네트워킹 응용 프로그램이되었으며, 따라서 많은 관심은 플랫폼에서 데이터를 효율적으로 수집하는 방법에 대한 범위입니다. 이 가이드에 대한 의견과 트위터 데이터에 대한 질문은 환영합니다. 기존 트위터 데이터 집합을 획득하기 위한 또 다른 옵션은 제가 개발한 웹 응용 프로그램인 TweetSets입니다. TweetSet을 사용하면 기존 데이터 집합을 쿼리하고 제한하여 고유한 데이터 집합을 만들 수 있습니다. 예를 들어 여성의 3월 데이터 집합에서 “trump”라는 용어가 포함된 원래 트윗만 포함하는 데이터 집합을 만들 수 있습니다. 로컬인 경우 TweetSets를 사용하면 전체 트윗을 다운로드할 수 있습니다. 그렇지 않으면 트윗 ID만 다운로드할 수 있습니다. 현재 TweetSets에는 거의 반억 개의 트윗이 포함되어 있습니다. 트위터에서 제공하는 API를 사용하려면 먼저 이러한 API에 연결하는 데 사용되는 일련의 Twitter API 키를 수집해야 합니다. 이 에 대 한 단계는 다음과 같습니다: 일부 교육 기관 트위터 서비스 공급자에 대 한 라이센스를 가지고 참고; 부서 또는 데이터 서비스 사서에게 문의하십시오.

그런 다음 데이터 집합에 메시지가 추가됩니다. 나중에 볼 수 있듯이 이 API에서 얻은 내용은 메시지에 게시된 텍스트일 뿐만 아니라 메시지를 게시한 사용자, 타임스탬프 등과 같은 많은 추가 정보가 있습니다. 트위터에서 데이터를 다운로드하는 방법에는 두 가지가 있습니다: 참고: 트위터 아카이브를 요청하기 전에 이메일 주소가 확인되고 트위터 아카이브를 다운로드하는 데 사용하는 브라우저와 동일한 브라우저에서 트위터 계정에 로그인했는지 확인하십시오. 이메일 주소를 확인하는 지침 및 문제 해결 팁은 여기에서 확인할 수 있습니다. 트위터 아카이브 다운로드를 준비하는 데 며칠이 걸릴 수 있습니다. 이러한 요소는 트위터 데이터 집합을 획득하는 가장 적합한 수단을 결정합니다. 이러한 도구 중 일부는 API에서 트윗을 검색하는 데 중점을 두며 다른 도구는 트위터 데이터 분석도 수행합니다. 자세한 내용은 라이어슨 대학교 테드 로저스 경영대학의 소셜 미디어 랩의 소셜 미디어 리서치 툴킷을 참조하십시오. 서비스 제공 업체에서 사용할 수있는 트위터 데이터 옵션은 일반적으로 다음 유형 중 하나 이상을 포함 (다른 비용으로 사용 가능): 아래 가이드는 파이썬 패키지 “GetOldTweets3″를 사용하여 트위터 데이터를 다운로드하는 방법을 보여줍니다 (문서를 찾을 수 있습니다 여기에).