Нову модель ШІ навчили за допомогою квантового комп'ютера: які переваги це дало
Квантова технологія виправляє помилки ШІ / Колаж 24 Каналу/Unsplash/IBMПоєднання класичного штучного інтелекту з квантовим комп'ютером IBM дозволило суттєво підвищити точність роботи моделі й зробити те, на що раніше вона не була здатна. Цей успішний експеримент відкриває шлях до створення надзвичайно ефективних гібридних систем майбутнього.
Як інтеграція квантових обчислень допомогла штучному інтелекту?
Цей технологічний прорив демонструє абсолютно новий підхід до навчання цифрового розуму. Дослідники провели експеримент, інтегрувавши класичну модель штучного інтелекту з квантовим комп'ютером від компанії IBM. Результати виявилися вражаючими: оновлена система змогла успішно та правильно відповісти на запитання, які ставили у глухий кут її базову версію. Про деталі цього унікального експерименту повідомляє видання Live Science.
Дивіться також Нова квантова технологія дозволить відмовитися від ключової деталі електроніки
Сучасна індустрія штучного інтелекту перебуває в стані постійної гонки за кількістю параметрів. Очікується, що майбутня модель GPT-5.5 матиме від 2 трильйонів до 5 трильйонів параметрів. Кожен такий параметр займає місце в пам'яті системи, що змушує технологічних гігантів будувати дедалі більшу й дорожчу інфраструктуру. Однак вчені з компанії Multiverse Computing запропонували альтернативний шлях: замість кількісного розширення використовувати якісне посилення за допомогою квантових обчислень.
У новому дослідженні, результати якого були опубліковані в базі препринтів arXiv, фахівці продемонстрували метод зниження невизначеності в системах ШІ за допомогою квантових комп'ютерів. Це стало першим випадком "квантового посилення" великої мовної моделі (LLM) виробничого рівня, яка вже широко використовується на ринку.
Для перевірки ефективності вчені обрали модель Llama 3.1 8B від компанії Meta, яка має 8 мільярдів параметрів. Головним показником якості в експерименті була здатність системи точно передбачати наступне слово в реченні. Модель із низьким рівнем показника PPL краще справляється з прогнозуванням, тоді як високий показник математично вказує на більшу ймовірність хаотичних або помилкових результатів.
Ці результати є, наскільки нам відомо, першою демонстрацією наскрізного квантового посилення широко розгорнутої LLM виробничого масштабу на реальному надпровідному квантовому обладнанні,
– прокоментували вчені в дослідженні.
Вони підкреслили, що важливий не стільки розмір покращення, скільки сам факт того, що воно стало можливим.
Технічно це було реалізовано через створення спеціальних блоків квантових схем, які називаються "унітарними адаптерами Кейлі". Параметри Кейлі – це набори математичних матриць, які можна тренувати на звичайному комп'ютері. Під час навчання оригінальні параметри мовної моделі Llama залишалися "замороженими", тобто незмінними. Нова гібридна система, що поєднала класичні параметри та навчені квантові адаптери, була запущена на 156-кубітному надпровідному квантовому процесорі IBM Quantum System Two.
Перше, що ви робите – кодуєте [параметри] в квантовому комп'ютері. Після кодування стану ви готові застосувати унітарний адаптер Кейлі, який ми навчаємо класично, а потім реалізуємо в квантовому обладнанні",
– розповів Борха Айзпуруа, старший науковий співробітник Multiverse Computing і перший автор дослідження.
Результати вразили: додавання всього 6 000 параметрів (що становить мізерні 0,000075% від загальної кількості) дозволило знизити рівень PPL на 1,4%. Це доводить, що квантові компоненти здатні значно покращувати роботу ШІ без потреби в гігантському розширенні класичної інфраструктури.
Тестування і практична цінність
Практична цінність методу підтвердилася під час тестування. Гібридна модель змогла правильно відповісти на запитання, які виявилися занадто складними для оригінальної Llama.
- Наприклад, у тесті з астрономії звичайна нейромережа помилково стверджувала, що кільця є лише у Сатурна. Квантово-посилена модель правильно ідентифікувала наявність кілець у всіх планет-гігантів (Юпітера, Сатурна, Урана та Нептуна).
- Аналогічна ситуація сталася і в біологічному тесті щодо наслідків потоку генів: базова модель дала помилкову відповідь про порушення рівноваги закону Гарді-Вайнберга, тоді як гібридна система правильно вказала на посилення генетичної однорідності.
Отже, тут ми бачимо приклад, коли модель не відповідає правильно, а потім ви додаєте щось квантове, і раптом вона дає правильну відповідь,
– прокоментував Борха Айзпуруа.
Без проблем не обійшлося
Однак розробники зіткнулися з серйозною перешкодою – квантовим "шумом". Чим більша квантова схема, тим більше перешкод виникає від взаємодії сусідніх кубітів, магнітного поля Землі, випромінювання Wi-Fi, мобільних телефонів і навіть космічних променів.
Ці завади можуть спричиняти помилки та робити результати обчислень безглуздими. Тому виправлення квантових помилок залишається ключовим напрямком для команди Multiverse Computing.
Дивіться також Наше майбутнє, про яке ми помиляємось: що таке квантові комп'ютери насправді
Що далі у планах
У майбутньому дослідники планують розробити методи прямого кодування всього квантового ланцюга, а не лише окремих адаптерів. Це має дозволити ШІ досягати ще вищої точності з використанням значно меншої кількості параметрів, ніж будь-який суто класичний метод.
Кінцевою метою вчених є досягнення "квантової переваги" – стану, коли квантова система виконує завдання, неможливі для найпотужніших сучасних суперкомп'ютерів.
Схожі новини
Can money buy happiness? Bill Gates offers a surprisingly honest answer
The Abraham Accord plus: Trump aims for grand bargain tying Islamic world with Israel
'For Brothers': Major international gang busted in Canada, 17 Indians charged for extortion targeting South Asians