Google разработал TurboQuant для сокращения памяти ИИ-моделей в шесть раз
Исследователи Google представили новый квантовый алгоритм TurboQuant, который позволяет существенно уменьшить объем памяти, необходимой для работы больших языковых моделей (LLM),…