База данных для обучения ИИ охватывает 48 000 каналов.
Эксперты из Proof News совместно с Wired провели расследование и выяснили, что сразу несколько крупных компаний, включая Apple, Nvidia и Salesforce, использовали набор данных из 170 000 видеороликов с YouTube для обучения своих систем искусственного интеллекта.
Источники отмечают, что компании тренировали свои нейросети на субтитрах к видеороликам на YouTube. Разумеется, разрешения у блогеров или самой платформы они не брали. В датасет вошли видео с 48 000 каналов, но только текстовая часть — видео и изображения не использовались. Примечательно, что компании брали видео с популярных каналов, таких как MrBeast, MKBHD, The Verge и нескольких новостных агентств.
Эксперты Proof News выпустили интерактивный инструмент, который позволяет находить каналы в датасете. Представители платформы YouTube пока не ответили на запросы СМИ.
Бедный ИИ, за что они его так(
Они б еще к тиктоку подключили, тогда восстание машин бы уже началось.
Главное чтобы к ру тв не подключали, а то он весь мир в ядерный пепел превратит.
Хочу тебе открыть страшную тайну. У этих контор дохера денег для того чтобы нанять фабрику индусов, которые будут эти видео фильтровать.
Учить нейросеть по мр.бисту и тп, ну.. не ждите поумнения ИИ.
Завидуешь лучшему блогеру в мире?
если для тебя он "лучший" то это печально.
Если для тебя он худший, то это печально. То как он распоряжается деньгами, никто и никогда не делал. Люди сделали правильного человека известным. А тебе и другим остаётся лишь завидовать и пойти дальше смотреть Повидлыча.
ну значит будет у нас вместо 3 руки, сразу 6
Обучалась только на субтитрах, видео и аудио не использовалось. Мне даже интересно что это за сеть такая, какое ее предназначение, генерировать рандомные субтитры?