Apple и NVIDIA тренировали свои нейросети на видеороликах с YouTube

База данных для обучения ИИ охватывает 48 000 каналов.

Эксперты из Proof News совместно с Wired провели расследование и выяснили, что сразу несколько крупных компаний, включая Apple, Nvidia и Salesforce, использовали набор данных из 170 000 видеороликов с YouTube для обучения своих систем искусственного интеллекта.

Источники отмечают, что компании тренировали свои нейросети на субтитрах к видеороликам на YouTube. Разумеется, разрешения у блогеров или самой платформы они не брали. В датасет вошли видео с 48 000 каналов, но только текстовая часть — видео и изображения не использовались. Примечательно, что компании брали видео с популярных каналов, таких как MrBeast, MKBHD, The Verge и нескольких новостных агентств.

Эксперты Proof News выпустили интерактивный инструмент, который позволяет находить каналы в датасете. Представители платформы YouTube пока не ответили на запросы СМИ.

13
10
Комментарии:  10
Ваш комментарий

Бедный ИИ, за что они его так(

Они б еще к тиктоку подключили, тогда восстание машин бы уже началось.

Главное чтобы к ру тв не подключали, а то он весь мир в ядерный пепел превратит.

Хочу тебе открыть страшную тайну. У этих контор дохера денег для того чтобы нанять фабрику индусов, которые будут эти видео фильтровать.

Учить нейросеть по мр.бисту и тп, ну.. не ждите поумнения ИИ.

Завидуешь лучшему блогеру в мире?

если для тебя он "лучший" то это печально.

Если для тебя он худший, то это печально. То как он распоряжается деньгами, никто и никогда не делал. Люди сделали правильного человека известным. А тебе и другим остаётся лишь завидовать и пойти дальше смотреть Повидлыча.

ну значит будет у нас вместо 3 руки, сразу 6

Обучалась только на субтитрах, видео и аудио не использовалось. Мне даже интересно что это за сеть такая, какое ее предназначение, генерировать рандомные субтитры?