LlamaGym

По запросу

Описание

LlamaGym - это open-source Python фреймворк, созданный для упрощения тонкой настройки агентов на базе больших языковых моделей (LLM) с использованием онлайн-обучения с подкреплением. Предоставляя стандартизированную среду, похожую на Gym от OpenAI, LlamaGym позволяет разработчикам эффективно обучать LLM-агентов, управляя контекстом диалога, пакетной обработкой эпизодов, назначением вознаграждений и настройкой оптимизации proximally policy. Этот фреймворк обеспечивает быстрое экспериментирование с промптингом агентов и гиперпараметрами в различных средах Gym, способствуя разработке более способных и отзывчивых ИИ-агентов.

Целевая аудитория

  • Исследователи ИИ
  • инженеры машинного обучения
  • разработчики ПО
  • специалисты по данным

Детали

Разработчик
LlamaGym
Модели ИИ
LLaMA
Ключевые слова
фреймворк ИИТонкая настройка языковой моделиPythonИИ-агентИИ-агент storeоткрытый исходный кодОбучение с подкреплениемИИИИ ассистентИИ помощникИИ-агентбиржа ИИ агентовмаркетплейс ИИ агентов