Laude Institute презентував першу групу переможців грантової програми Slingshots, спрямованої на підтримку розвитку науки та практики штучного інтелекту. Програма створена як акселератор для дослідників, надаючи їм ресурси, які зазвичай недоступні у традиційних академічних умовах – це фінансування, обчислювальні потужності, а також підтримка продуктового й інженерного напрямків.
Про це розповідає ProIT
Перший набір та фокус на оцінюванні ШІ
У першій когорті підтримано 15 проєктів, значна частина яких сконцентрована на складних питаннях оцінки систем штучного інтелекту. Серед них – добре відомі у професійній спільноті бенчмарки, як Terminal Bench для перевірки командного програмування, а також нова версія довготривалого проєкту ARC-AGI.
Деякі проєкти пропонують інноваційні підходи до традиційних задач оцінювання. Так, команда з Caltech та UT Austin розробляє Formula Code для перевірки здатності ШІ-агентів оптимізувати існуючий код. Інший проєкт – BizBench, заснований у Колумбії, створює загальний бенчмарк для оцінки так званих «білих комірців» – ШІ-агентів, що виконують офісну роботу. Окремі гранти зосереджені на нових структурах для навчання з підкріпленням та стисканні моделей.
Інновації у підходах до оцінювання
До когорти долучився й Джон Бода Ян, співзасновник SWE-Bench, який очолив новий проєкт CodeClash. Надихнувшись успіхом SWE-Bench, цей проєкт перевірятиме якість коду в умовах динамічного змагання, що має стимулювати розвиток галузі.
“I do think people continuing to evaluate on core third-party benchmarks drives progress,” Yang told TechCrunch. “I’m a little bit worried about a future where benchmarks just become specific to companies.”
Програма Slingshots передбачає, що грантоотримувачі зобов’язуються продемонструвати конкретний результат – це може бути стартап, база відкритого коду чи інший вагомий продукт. Такий підхід має стимулювати не лише наукові відкриття, а й їхню практичну реалізацію у сфері штучного інтелекту.