Трумультимодальность. До вечернего стрима от OpenAI у нас, похоже, идет день Google и Gemini
Трумультимодальность.
До вечернего стрима от OpenAI у нас, похоже, идет день Google и Gemini.
OpenAI ТОЧНО пора показать обновленный DALL·E 3, ибо смотрите, что творит Gemini. Причем творит сама по себе, без вызова всяких Imagen-ов - это трумултимодальная модель.
Поглядите все видосики обязательно.
Путешествия по картинкам меня до сих пор восхищают, типа поверни вправо и, особенно, отъедь назад. Хотя такое мы видели в последний месяц регулярно, особенно у видеогенераторов. Но тут повторюсь монолитный чат и хорошее качество.
А вот пример с газовой горелкой - просто отличный: “нарисуй то, что случится, когда горелка повернется“.
Визуальная цепочка мыслей.
“Включи телевизор“ - тоже неплохо.
Источник тут.
В общем, я прям жду, что ответит OpenAI, прежде чем делать мучительные выборы.
И поднимите веки Midjourney кто-нибудь. Неприлично уже.
2 views
22
2
4 hours ago 00:00:12 2
Трумультимодальность. До вечернего стрима от OpenAI у нас, похоже, идет день Google и Gemini