Повідомлення Gate News, 16 квітня — Google і Boston Dynamics оголосили про інтеграцію втілених моделей міркувань Gemini Robotics у чотириногого робота Spot, що дозволяє системі інтерпретувати інструкції природною мовою, розпізнавати об’єкти та виконувати складні завдання автономно.
Співпраця, спираючись на експериментальні напрацювання з внутрішнього хакатону 2025 року, дає Spot змогу обробляти вхідні візуальні дані та перетворювати високорівневі команди на скоординовані фізичні дії. На відміну від традиційного програмування роботів, яке спирається на жорстку покрокову логіку, система використовує розмовні підказки та проміжний програмний рівень, що з’єднує моделі Gemini з API Spot. ШІ може обирати з попередньо визначених можливостей, зокрема навігації, розпізнавання об’єктів, зйомки зображень, захоплення та розміщення, а отримання зворотного зв’язку в реальному часі забезпечує адаптивну поведінку без ручного втручання.
У демонстраціях система успішно інтерпретувала загальні інструкції щодо організації предметів, аналізуючи візуальні дані та спрямовуючи робота через послідовності дій. Підхід підтримує операційну безпеку, обмежуючи можливості ШІ заздалегідь визначеними межами в API робота, поєднуючи адаптивність із контрольованою продуктивністю. У партнерстві вбачають потенційні виграшні показники ефективності для розробників завдяки зменшенню обсягу ручного кодування та можливості для інженерів зосередитися на визначенні цілей, а не на програмуванні кожної послідовності дій.
Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до
Застереження.
Пов'язані статті
Модель медичної AI від Tether на 1,7 млрд перевершила сьогодні конкурента у 16 разів більшого розміру
За даними AI-дослідницької команди Tether, сьогодні компанія запустила медичні мовні моделі серії QVAC MedPsy, створені для локального розгортання на смартфонах і носимих пристроях без залежності від хмари. Версія з 1,7 млрд параметрів набрала 62,62 на семи медичних бенчмарках, перевершивши Google MedGemma-4B
GateNews5хв. тому
Оцінка Anthropic під час передпублічного розміщення (Pre-IPO) досягла $1,2 трильйона, перевищивши OpenAI на 20%
За даними Odaily, опосередкована оцінка Anthropic на блокчейн-ринку перед IPO досягла 1,2 трильйона доларів, обігнавши OpenAI приблизно на 20%. Якщо компанія вийде на біржу за цією оцінкою, вона посідатиме 11-те місце серед найбільших публічних компаній у світі за ринковою капіталізацією, поступаючись Apple,
GateNews10хв. тому
Фондове ралі в Південній Кореї випереджає глобальні ринки на тлі буму ШІ
Фондовий ринок Південної Кореї демонструє безпрецедентні зростання завдяки акціям напівпровідників, пов’язаним із штучним інтелектом: індекс KOSPI зріс на 78% цього року, випередивши всі інші ключові ринки у світі, згідно з даними Financial Modeling Prep, на які посилається аналіз Axios.
AI
CryptoFrontier18хв. тому
DeepL скорочує 25% персоналу (близько 250 співробітників), щоб реорганізувати бізнес у сфері ШІ
За даними Bloomberg, сьогодні 7 травня компанія DeepL — постачальник перекладацьких інструментів — оголосила, що звільнить приблизно 25% своїх співробітників, тобто близько 250 працівників, щоб адаптуватися до структурних змін, спричинених штучним інтелектом. Генеральний директор Ярек Ку тило вський (Jarek Kutylowski) заявив у LinkedIn, що компанія скоротить менеджмент
GateNews48хв. тому
NVIDIA представила Nemotron 3 Nano Omni — відкриту мультимодальну модель
NVIDIA опублікувала відкритий вихідний код багатомодального моделі Nemotron 3 Nano Omni: вона об’єднує візуальне сприйняття, мовлення та мову в межах єдиної моделі як сенсорний шар для AI-агентів. Її ядро — 30B-A3B MoE, 256K context, 9x пропускної здатності. Модель підтримує вхідні дані у вигляді тексту, зображень, аудіо та відео тощо, а виходом є текст. У поєднанні з Nemotron 3 Super/Ultra вона застосовна для сценаріїв на кшталт керування комп’ютером, інтелекту з документами та розуміння аудіовізуального контенту; також оприлюднено ваги та навчальні дані, а розгортання охоплює локальні середовища, NIM і сторонні платформи.
ChainNewsAbmedia1год тому
Cursor розкриває метод тренування для автозапуску, підвищує продуктивність Composer 2 на 14 процентних пунктів
Згідно з недавнім розкриттям Cursor компанія представила навчальну техніку під назвою autoinstall для серії моделей Composer: використання попередньої версії моделі для автоматичного налаштування виконуваних середовищ для підкріпленого навчання наступного покоління. Під час навчання Composer 2, Cursor
GateNews1год тому