Переможці грантів Slingshots для досліджень ШІ

Laude Institute презентував першу групу переможців грантової програми Slingshots, спрямованої на підтримку розвитку науки та практики штучного інтелекту. Програма створена як акселератор для дослідників, надаючи їм ресурси, які зазвичай недоступні у традиційних академічних умовах – це фінансування, обчислювальні потужності, а також підтримка продуктового й інженерного напрямків.

Про це розповідає ProIT

Перший набір та фокус на оцінюванні ШІ

У першій когорті підтримано 15 проєктів, значна частина яких сконцентрована на складних питаннях оцінки систем штучного інтелекту. Серед них – добре відомі у професійній спільноті бенчмарки, як Terminal Bench для перевірки командного програмування, а також нова версія довготривалого проєкту ARC-AGI.

Деякі проєкти пропонують інноваційні підходи до традиційних задач оцінювання. Так, команда з Caltech та UT Austin розробляє Formula Code для перевірки здатності ШІ-агентів оптимізувати існуючий код. Інший проєкт – BizBench, заснований у Колумбії, створює загальний бенчмарк для оцінки так званих «білих комірців» – ШІ-агентів, що виконують офісну роботу. Окремі гранти зосереджені на нових структурах для навчання з підкріпленням та стисканні моделей.

Інновації у підходах до оцінювання

До когорти долучився й Джон Бода Ян, співзасновник SWE-Bench, який очолив новий проєкт CodeClash. Надихнувшись успіхом SWE-Bench, цей проєкт перевірятиме якість коду в умовах динамічного змагання, що має стимулювати розвиток галузі.

“I do think people continuing to evaluate on core third-party benchmarks drives progress,” Yang told TechCrunch. “I’m a little bit worried about a future where benchmarks just become specific to companies.”

Програма Slingshots передбачає, що грантоотримувачі зобов’язуються продемонструвати конкретний результат – це може бути стартап, база відкритого коду чи інший вагомий продукт. Такий підхід має стимулювати не лише наукові відкриття, а й їхню практичну реалізацію у сфері штучного інтелекту.