Поиск по архивам: как найти историю семьи в документах XVIII века (yet another podcast #33)
Год назад Яндекс запустил «Поиск по архивам». Это сервис, в котором можно искать информацию по архивным документам почти как в интернете. Для этого разработчики обучили нейросети расшифровывать рукописные записи со сложной дореволюционной орфографией.
Сейчас в базе более 11 миллионов архивных документов из хранилищ Москвы, Астраханской, Оренбургской, Иркутской и других областей. Это метрические книги, исповедные ведомости и ревизские сказки XVIII — начала XX века. Они будут полезны как историкам, так и тем, кто хочет больше узнать о прошлом своей семьи.
👉 «Поиск по архивам»:
В yet another podcast обсуждаем, что интересного можно найти в архивах и как мы обучили нейросеть распознавать букву Ѣ. Разобраться с исторической темой помогают руководитель «Поиска по архивам» Александр Болховитянов и руководитель группы распознавания текста Татьяна Сапатова.
yet another podcast — регулярный подкаст о новых технологиях, продуктах Яндекса и людях, которые над ними работают. В каждом выпуске ведущий Павел Кушелев с гостями обсуждают один продукт компании: большое обновление, важную разработку и стоящие за ними процессы.
🦸♂️ В гостях — Иван Корякин, автор телеграм-канала «Генеалогика» и подкаста «Откуда родом»
🎧 НА ДРУГИХ ПЛАТФОРМАХ:
• Яндекс Музыка:
• Apple Podcasts:
• Google Podcasts:
⚡ ЧТО В ВЫПУСКЕ
00:00 — Поиск, но не в интернете
02:13 — Сколько архивов в России
05:23 — Легенда про суперархив мормонов
11:19 — Раньше даже бумага была лучше
13:13 — Как сделать запрос в архив
17:47 — Фонд и опись: глоссарий архивов
19:29 — Архивный мем!
22:00 — Зачем придумали «Поиск по архивам»
23:19 — Три главных вызова
27:03 — Как обучали нейросеть
31:39 — Что такое метрическая книга
34:30 — Нейросеть видела слова везде
39:27 — Учили на «Анне Карениной»
42:58 — Байка про The Beatles
46:50 — Ефросинья или баранина
49:41 — 40 000 долларов за 10 символов
54:23 — Особенности старой орфографии
01:02:48 — Нейросеть YASTREB
01:05:01 — Распознавание почерка врачей?
01:08:21 — Особенности тайского и корейского
01:10:39 — Тамбов как треть Европы
01:13:37 — Про коллаб с Genotek и «Великими описями»
01:19:38 — Кушелев — про семейное древо
01:21:48 — С чего начать поиск предков
01:25:42 — Да, но зачем всё это?
33 views
156
37
1 month ago 00:01:00 1
Эрнст Мулдашев. Слепой Сидоров автостопом из Чукотки до Уфы. #мулдашев
1 month ago 00:00:00 1
Стрим По Rodina Rp ( Найты Розыгрыши) Обнова
1 month ago 00:01:00 1
Кто отнимает вашу зарплату? // Олег Комолов. Аналитика с колёс #4
1 month ago 01:39:08 1
ЖЕНСКАЯ ЛОГИКА - 4
1 month ago 01:32:55 1
Дмитрий Павлов: Новые находки — В поисках африканской Атлантиды
1 month ago 00:32:51 1
Найден «Фитиль» режиссёра Леонида Гайдая | Комедия
1 month ago 00:08:26 1
Невозможный Эрмитаж
1 month ago 00:00:00 1
Battle Brothers. Карловое Папство. Stream. Часть Девятая
1 month ago 00:01:00 1
Эрнст Мулдашев. Нет закона против зависти. #мулдашев #профессор
1 month ago 00:02:27 1
Паша Техник - Нужен Ксанакс (но это григорианский хор)
1 month ago 01:31:32 1
ВАДИМ САМОЙЛОВ о судьбе «Агаты Кристи», культуре протеста, патриотизме и поиске истины
1 month ago 05:16:52 1
САМАДХИ - ЛУЧШАЯ ПОДБОРКА ФИЛЬМОВ О ПРОСВЕТЛЕНИИ (7 серий).
1 month ago 00:14:15 1
ЭТУ ПИРАТСКУЮ GTA ИСКАЛИ 20 ЛЕТ! - GTA: Max Pain’s Mod - Обзор Утерянной Пиратки GTA
1 month ago 00:02:58 1
Марк Тишман, Юля Паршута - Маяковский (Премьера 2022)