Типичная ошибка нейросеточек и искусственных интеллектов, исправления которой не предвидится:
если кожаный ублюдок делает такой-то запрос - значит, собирается купить.
На самом деле нет. В 90% случаев нет.
Не дай Бог ткнуть в приложении Авито в какое-то обьявление. После этого вся лента будет забита.
вся реклама работает по принципу "Наташенька, позвольте вам впердолить" (ц)
Про 90% это гражданин хвалит такие системы, там за 1% конвертации на руках носить будут.
Это так работает та самая цифровая антиутопия, которую описывает Ашманов. И в которой мы уже пребываем. Вообще я с ним согласен, мы уже во многом там. Но работает это все примерно так, как описано выше. При том, что нужно понимать масштабы обучения в крупнейших поисковых машинах. А на выходе вот такие пшики, а то и пуки.
Пояснить, почему именно так происходит могут не только лишь все, но смысл? Думаю, разработчики и сами понимают залипушность своих систем и что именно надо доворачивать, чтобы было хоть чуток похоже на правду. Но это требует много чего дополнительно как в плане ресурсов, так и в плане сложности описания предметной области и последующей разработки. Для того, чтобы сделать грамотный ИИ надо самому представить, как это будет работать. Да, для того, чтобы понять рекурсию - надо понять рекурсию. А это противоречие вообще всей ИИ-шной идеологии, извините.
Собственно, весь бум ИИ и прочего не более, чем попытка избежать описания сложных предметных областей и поведения в них больших дискретных систем. А попытка возникла как простейшая реакция на неудовлетворительность способов описания оныхЪ областей и оного поведения. И тут-то и родилась гениальная идея - а давайте не будем описывать вовсе, пусть оно как-то там само собой. Т.е. на обучающей выборке восстановит неявные и неформализованные зависимости внутри черного ящика.
Пока неявные зависимости ограничены сверху тем же словарем - да, это работает. Голос в печатный текст мы можем. И с картинки текст можем распознать. Вариантов не так много, чтобы научиться за реальное время. А вот читают книги программы все так же мерзко. Потому как интонации, паузы, ударения...
Это все очевидно и банально. Но тут опять в голову лезет своя мифология с хорошо раскрученными красивыми словами. Неприятная правда в том, что такая мифология продается. Усваивает какой-нибудь дебилушка data mining, big data и deep learning - все, можно ставить манагером, мейкать десижны и эпрувить солюшены. Или диспенсеры с пленкой на складе расставлять, например.
Потому сегодня так дебильна контекстная реклама и не только. Повторюсь, на совершенно диких обучающих выборках. Но - так всем удобно. Никто развенчивать никакие биг даты не будет. Продает? Отлично, отойди от машины, не залапывай колеса.
Просто мы будем ставить все более продвинутые эдблоки и прочие баннерорезки. А нам будут все чаще говорить - отключите блокировку, мы же с рекламы живем и хотим вам показать вот ту дебильную рекламу, которая все равно не приведет к покупке. Или, напротив, демотивирует вас, даже если бы и хотели.
Да оно и неплохо, наверное. Хуже будет, когда научатся попадать.
Потому большая просьба никому не выдавать эту страшную тайну.
PS: Так работает настоящий data mining & deep learning:
xxx: анонимный форум порнографического толка. парень выложил фото голышом в зеркале, поставленном среди горшков с растениями, попросил оценить. сбежались благородные доны (или доньи, кто разберёт), в грандиозном сраче на четырёх языках распознали все растения в горшках вплоть до сорта
Тут старый анекдот про картинку с рентгеном орального секса и срачем стоматологов об установке штифтов в комментах.