Нейросети Яндекса обучили искать данные в архивах газеты «Советский спорт» за 100 лет.
Пользователи могут ознакомиться со сканами практически всех номеров газеты, выпускавшихся с 1922 по 2022 год. Теперь в архивах «Советского спорта» можно найти информацию о конкретных людях и событиях и соревнованиях.
Нейросеть была адаптирована под вёрстку газетных страниц. Специалисты вручную обработали тысячи страниц и разметили их на блоки: от заголовков и колонок, до рекламы и надписей на форме спортсменов.
Теперь архив газеты «Советский спорт» передан Российской государственной библиотеке. Разработчики планируют использовать нейросеть для ориентации в других типах сложной вёрстки, например, рукописных архивов.