본문 바로가기

(2)
TED에서 가장 많이 나온 단어 TED 사이트(ted.com)에 등록된 톡들은 영문으로 번역된 스크립트들을 포함하고 있습니다. 가장 최근에 등록된 톡들로부터 이 스크립트들을 가지고 와서 그들 속에 포함된 단어들을 많이 언급된 순서로 줄 세워 보았습니다. 즉, 검색엔진의 'BOT'들이 하는 행동을 똑같이 하는 작은 BOT 스크립트를 만들어 TED사이트의 최신 게시물 200개를 훑었고 200개의 게시물이 가지고 있는 단어들 중 가장 많이 사용된 단어 100개를 추출해 보았습니다. 거두절미하고 가장 많이 언급된 단어는 'like' 입니다. 헌데, 이에 관해서 문제가 좀 있습니다. 아시다피시 'like'는 동사의 역할뿐 아니라 전치사, 형용사의 역할을 하며 그들의 의미를 표현하기 위해 쓰이기도 합니다. 그래서 동사로 쓰인 것과 그렇지 않은 표..
인터넷 세상에서 스팸봇이 가지는 순기능? 블로거 혹은 홈페이지를 가지고 있는 개인이나 웹 사이트 관리자들에게 스팸봇이 남기고 가는 게시물은 매우 탐탁치 않다. 게시물의 내용은 대부분 광고성이고 또 전혀 연관성 없거나 의미를 알 수 없이 깨어진 내용이 대부분이기 때문이다. 게다가 지능적인 봇에 의해 쓰여진 관련성 있는 게시물은 오히려 정상 방문자들에게 큰 오해를 주기도 하면서 관리자를 난관에 빠뜨리기도 한다. 그와중에 제대로 동작하는 필터 기능을 탑제해 놓지 않으면 게시판이나 댓글란이 스팸봇의 반복 방문으로 순식간에 스팸 게시물로 도배 되어 버린다. 더 중요한 점은- 그로인해 회원과 여타 방문자들이 껄끄럽게 느껴질 분위기로 웹사이트의 모습은 변화되어가고 결국, 잘 관리되지 않는 곳이라는 인상을 남기게 되면서 방문자들의 발길이 끊어진다. 이후, 해..