Поиск по архивам: как найти историю семьи в документах XVIII века (yet another podcast #33)
Год назад Яндекс запустил «Поиск по архивам». Это сервис, в котором можно искать информацию по архивным документам почти как в интернете. Для этого разработчики обучили нейросети расшифровывать рукописные записи со сложной дореволюционной орфографией.
Сейчас в базе более 11 миллионов архивных документов из хранилищ Москвы, Астраханской, Оренбургской, Иркутской и других областей. Это метрические книги, исповедные ведомости и ревизские сказки XVIII — начала XX века. Они будут полезны как историкам, так и тем, кто хочет больше узнать о прошлом своей семьи.
👉 «Поиск по архивам»:
В yet another podcast обсуждаем, что интересного можно найти в архивах и как мы обучили нейросеть распознавать букву Ѣ. Разобраться с исторической темой помогают руководитель «Поиска по архивам» Александр Болховитянов и руководитель группы распознавания текста Татьяна Сапатова.
yet another podcast — регулярный подкаст о новых технологиях, продуктах Яндекса и людях, которые над ними работают. В каждом выпуске ведущий Павел Кушелев с гостями обсуждают один продукт компании: большое обновление, важную разработку и стоящие за ними процессы.
🦸♂️ В гостях — Иван Корякин, автор телеграм-канала «Генеалогика» и подкаста «Откуда родом»
🎧 НА ДРУГИХ ПЛАТФОРМАХ:
• Яндекс Музыка:
• Apple Podcasts:
• Google Podcasts:
⚡ ЧТО В ВЫПУСКЕ
00:00 — Поиск, но не в интернете
02:13 — Сколько архивов в России
05:23 — Легенда про суперархив мормонов
11:19 — Раньше даже бумага была лучше
13:13 — Как сделать запрос в архив
17:47 — Фонд и опись: глоссарий архивов
19:29 — Архивный мем!
22:00 — Зачем придумали «Поиск по архивам»
23:19 — Три главных вызова
27:03 — Как обучали нейросеть
31:39 — Что такое метрическая книга
34:30 — Нейросеть видела слова везде
39:27 — Учили на «Анне Карениной»
42:58 — Байка про The Beatles
46:50 — Ефросинья или баранина
49:41 — 40 000 долларов за 10 символов
54:23 — Особенности старой орфографии
01:02:48 — Нейросеть YASTREB
01:05:01 — Распознавание почерка врачей?
01:08:21 — Особенности тайского и корейского
01:10:39 — Тамбов как треть Европы
01:13:37 — Про коллаб с Genotek и «Великими описями»
01:19:38 — Кушелев — про семейное древо
01:21:48 — С чего начать поиск предков
01:25:42 — Да, но зачем всё это?
1 view
1871
602
10 years ago 00:02:20 0
Поиск информации по изображению
11 years ago 00:20:36 303
Поиск по старине.Очередной поиск на урочище.
10 years ago 00:02:35 760
Поиск по картинке в Гугл - как работает поиск по изображению
8 years ago 00:01:29 84
Поиск по пользователям ВКонтакте
6 years ago 02:02:14 5
Поиск по заброшенным деревням
8 years ago 00:05:02 569
Поиск ВКонтакте по новостям.
10 years ago 00:12:41 228
ПОИСК ПОСТАВЩИКА ПО ЩЕБНЮ
12 years ago 00:04:07 76
Поиск по ТаоБао
6 years ago 00:01:38 78
Поиск по стене
5 years ago 00:07:30 919
Поиск по картинке и подготовка изображения для гравировки.
13 years ago 00:03:15 339
рафаэла кара - Поиск по видео - Поиск@
8 years ago 00:02:07 20
Поиск по Избранному
9 years ago 00:06:43 1
Поиск по AD
7 years ago 00:08:29 604
Поиск по картинке и быстрая трассировка в CorelDraw
12 years ago 00:15:38 324
Как сделать поиск по рубрикам в ВК
8 years ago 00:01:16 1K
Поиск по фото на Lamoda
11 years ago 00:10:36 383
Легенда поиска. Поиск по войне
11 years ago 00:01:17 309
Поиск по номеру телефона ВК
10 years ago 00:10:59 196
DELPHI Урок 4 Поиск по БД, быстрый поиск по БД
5 years ago 00:04:45 35
Поиск по ЕГЭ
7 years ago 00:08:19 76
Создание интерфейса пользователя и поиск по запросу