Медиановости
/ Медиасреда

2 августа 2023 17:28

Нейросеть «Яндекса» распознала 24 тысячи выпусков газеты «Советский спорт»

Нейросеть «Яндекса» распознала 24 тысячи выпусков газеты «Советский спорт»Фото: Советский спорт / ВКонтакте

Нейросети Яндекса обучили искать данные в архивах газеты «Советский спорт» за 100 лет.

Пользователи могут ознакомиться со сканами практически всех номеров газеты, выпускавшихся с 1922 по 2022 год. Теперь в архивах «Советского спорта» можно найти информацию о конкретных людях и событиях и соревнованиях.

Нейросеть была адаптирована под вёрстку газетных страниц. Специалисты вручную обработали тысячи страниц и разметили их на блоки: от заголовков и колонок, до рекламы и надписей на форме спортсменов.

Теперь архив газеты «Советский спорт» передан Российской государственной библиотеке. Разработчики планируют использовать нейросеть для ориентации в других типах сложной вёрстки, например, рукописных архивов.