chemist
New member
Команда учёных, ИТ-специалистов из нескольких американских и британских университетов и Microsoft Research выявили связь между содержанием и эмоциональным окрасом сообщений в Twitter и доходом пользователей. Люди с высоким доходом публикуют новости о политике и выражают гнев, а с меньшим — используют нецензурную лексику и публикуют оптимистичные сообщения.
В Великобритании существует «The Standard Occupational Classification» — система, классифицирующая работников по сложности и квалификации труда. В эту иерархию входят девять классов. Учёные отобрали пять тысяч аккаунтов, представляющих все девять классов, и обработали базу из десяти миллионов их твитов.
В процессе обработки твитов учёные отобрали специфические слова, чаще всего встречающиеся у каждого класса. Для каждого класса алгоритм отобрал слова, которые по частоте употребления сильно отличаются от частоты в других классах. Затем исследователи вручную сгруппировали результаты по категориям и по эмоциональному окрасу.
Люди, имеющие более высокий доход, реже выражают религиозность и более спокойно ведут себя. У них больше фолловеров и ретвитов, чем у пользователей с меньшим доходом, хотя они отправляют меньше сообщений и меньшее количество ссылок. Автоматический анализ языка выявил, что люди с высоким доходом чаще выражают гнев и страх, публикуют новости о политике, негосударственных организациях и сообщения о корпорациях.
Люди с меньшим доходом чаще используют нецензурную лексику, но их сообщения более оптимистичны. Они пользуются Twitter для общения на повседневные темы.
Полученные данные позволят решать обратную задачу — угадывать доход пользователей по Twitter, во всяком случае в Великобритании.
http://geektimes.ru/post/263360/
Хах, ну что СКИС узнаешь себя? Матюкаешься и безработный, попадание чуть более чем полностью. :gg:
В Великобритании существует «The Standard Occupational Classification» — система, классифицирующая работников по сложности и квалификации труда. В эту иерархию входят девять классов. Учёные отобрали пять тысяч аккаунтов, представляющих все девять классов, и обработали базу из десяти миллионов их твитов.
В процессе обработки твитов учёные отобрали специфические слова, чаще всего встречающиеся у каждого класса. Для каждого класса алгоритм отобрал слова, которые по частоте употребления сильно отличаются от частоты в других классах. Затем исследователи вручную сгруппировали результаты по категориям и по эмоциональному окрасу.
Люди, имеющие более высокий доход, реже выражают религиозность и более спокойно ведут себя. У них больше фолловеров и ретвитов, чем у пользователей с меньшим доходом, хотя они отправляют меньше сообщений и меньшее количество ссылок. Автоматический анализ языка выявил, что люди с высоким доходом чаще выражают гнев и страх, публикуют новости о политике, негосударственных организациях и сообщения о корпорациях.
Люди с меньшим доходом чаще используют нецензурную лексику, но их сообщения более оптимистичны. Они пользуются Twitter для общения на повседневные темы.
Полученные данные позволят решать обратную задачу — угадывать доход пользователей по Twitter, во всяком случае в Великобритании.
http://geektimes.ru/post/263360/
Хах, ну что СКИС узнаешь себя? Матюкаешься и безработный, попадание чуть более чем полностью. :gg: