Статистические модели предсказывают успех на Kickstarter в течение 4 часов
То, что думают о вашем проекте на Kickstarter, имеет в этой модели огромное значение.
Марковская модель прогнозирования использует срок финансирования и информацию о создателе.
Kickstarter стал главным источником Интернет-историй о Золушках, чьи проекты получили популярность благодаря симпатиям пользователей. На Kickstarter существует несколько степеней успеха, и ученые выяснили, как можно его предсказать, определив, «выживет» ли проект или нет в течение первых четырех часов своего существования. Согласно докладу, сделанному в начале октября, их метод частично основан на репутации в соцсети.
Три исследователя из Éccole Polytechnique Fédérale de Lausanne создали статистические модели, основанные на данных о финансировании и обсуждениях в Twitter. Данные были собраны с более 16 000 кампаний Kickstarter, которые в общей сложности собрали $158 миллионов, примерно половина из них потерпела неудачу.
Ученые собрали данные из Twitter с помощью поиска слова "kickstarter” и URL сайта в твитах. Они заходили на страницы создателей проектов, чтобы узнать, кто из пользователей какую сумму обещал, и сколько они собрали в общем. Последним шагом стал показатель времени. Таким образом, все было сделано в течение двух дней.
Сперва они включали в модель данные о создателе, модель цепей Маркова и классификацию K ближайших соседей. Для контроля результатов авторы использовали основную статическую модель, в которой учитываются такие факторы, как наличие видео, категория и финансовая цель.
В течение трех дней (это приблизительно 10% от срока действия проекта) обе модели приходят к окончательному результату с точностью 85%. Классификация ближайший соседей точнее и быстрее предсказывает успех, но исследователи отмечают, что эта модель значительно дороже в вычислительном отношении по сравнению с моделью Маркова.
Затем были добавлены твиты. Авторы добавили в модели данные из Twitter, включающие время, количество комментариев и репостов. Авторы пришли к выводу, что прогнозируемая модель, в которой используются только данные твитов, не дает лучших результатов на ранних стадиях кампании Kickstarter, по сравнению со статистической моделью.
При более подробном рассмотрении видно, что модель дает вполне точный прогноз будущего проекта на Kickstarter в течение нескольких часов.
Социальную досягаемость измерить довольно сложно. В сети наверняка много твитов, которые авторы пропустили. Например, если в разговоре о Kickstarter он просто не упомянут, или представлен сокращенный вариант URL.
Прогнозирующие модели довольно сложные, но все же они не учитывают все возможные варианты.
Трудно сказать наверняка, добьется ли тот или иной проект успеха или нет. Иными словами, результат не виден невооруженным глазом.