Navigating knowledge scape: learning higher-order structures from data | Любовь Тупикина
Мы поговорим о математических задачах, которые возникают при обработке больших данных. В частности, о задаче вложения пространств высокой размерности в пространства низкой размерности. Если действовать стандартными методами, при вложении данных часто можно столкнуться с серьезными проблемами, например, глобальная структура таких данных не представится точно, и что еще важнее — метрики низкоразмерного пространства выбираются «по умолчанию». Нас будет интересовать вопрос, какую модель вложения использовать в этих ситуациях [1,5], и вообще, когда этот вопрос для данных можно решить.
Мы исследуем т. н. латентное пространство (latent space) методов вложения, используя комбинацию двух подходов: вложения гиперграфов и техник уменьшения размерности [1,2,3]. В качестве одного из приложений нашего подхода мы рассмотрим данные текстов статей на , чтобы понять, как ландшафт знаний можно охарактеризовать с помощью представления данных высшей арности (гиперграфов) [1,3]. Мы также обсудим открытые проблемы, такие как вопрос о том, как такое представление данных в виде гиперграфа может быть связано с объяснимостью архитектуры моделей встраивания типа BERT и/или автокодировщиков [4]. Мы также затронем некоторые темы из Лектория: лекции по математическим основам машинного обучения и некоторые базовые понятия топологии .
[1] C. Singh, L. Tupikina, M. Starnini, M. Santolini “Charting mobility patterns in the scientific knowledge landscape” () EPJ data science (2024)
[2] C. Singh, E. Barme, R. Ward, L. Tupikina, M. Santolini “Quantifying the rise and fall of scientific fields“ ( Plos One 17(6): (2022)
[3] A. Bretto “Hypergraphs theory: An Introduction“ (~saito/data/tensor/) Springer, 2192-4732 (2013)
[4] M. Grootendorst “BERTopic: Neural topic modeling with a class-based TF-IDF procedure“ ()
[5] C. Fefferman, S. V. Ivanov, M. Lassas, H. Narayanan “Fitting a manifold to data in the presence of large noise“ ()
38 views
4111
1540
4 weeks ago 00:08:10 1
AI Agents Will Create MILLIONAIRES in 2025 – Are You Ready
1 month ago 00:04:41 1
Crypto Wallet | Best Bitcoin Wallet | Top Crypto Wallet
2 months ago 00:34:37 1
Scientific integrity
2 months ago 00:22:16 16
Blender Beginners For Concept Art - TUTORIAL
2 months ago 00:05:11 1
Unban Tinder Account in 24 Hours! How to Fix Tinder Shadowbans Easily
2 months ago 00:04:20 1
How to File a Missouri Bar Complaint Against Unethical Missouri Attorneys
2 months ago 00:06:32 1
Confrontations: 3 Simple Tips To Gain An Advantage
2 months ago 00:46:13 1
Occult Government Exposed: Today’s Wars
2 months ago 00:04:05 1
Drying Porcini Mushrooms in the Food Dehydrator
2 months ago 00:06:23 1
The Coming Crypto Bull Run Will Be a Game-Changer!
2 months ago 00:04:05 1
2014 Dodge Challenger, Gateway Classic Cars, St Louis #9709
2 months ago 00:00:00 1
Michio Kaku Breaks Silence On James Webb Telescope’s Discovery Of 700 Galaxies That Shouldn’t Exist
2 months ago 00:00:31 1
Medieval Younger Sons: Knights, Monks, or Forgotten? #history #trivia #funfacts
2 months ago 00:24:06 1
They Were So Jealous, They Teamed Up Against 🫵🏾 But Still Failed...
2 months ago 00:04:26 1
Best Crypto Exchange | Crypto Trading | Safest Crypto Exchange
2 months ago 00:12:18 1
Find the Best Crypto Exchange: A Step-by-Step Guide
2 months ago 00:03:02 1
What are Bonding Curves, Circulating Supply & Market Cap? | Blum Academy
2 months ago 00:04:24 1
【MV】アイリフドーパ(AILIFDOPA) 「NEVES」Official Music Video
2 months ago 00:47:12 1
Signs Of A Spiritual Attack - This Only Happens When You Are God’s Chosen - The Bible Stories
2 months ago 00:09:51 1
FREE TONCOIN From CATS AIRDROP Withdrawal : Swap Your Crypto Airdrops To Ton coin On Bybit NOW
2 months ago 00:05:18 1
Uptober or Downtober? Be Prepared for What’s to Come!
2 months ago 00:04:35 1
Health catastrophe with Dr. Dhand
2 months ago 00:00:10 1
HELLDIVERS 2 - POV: STIM Pistols Can Be A Bad Idea
2 months ago 00:00:26 1
how to reverse park | car parking | 🅿️|#reverseparking #cardriving #parking #körkort #shorts