
Недавно Google Cloud запустила поддержку графического процессора для платформы Cloud Run без сервера. Эта функция позволяет разработчикам ускорить без сервера вывод моделей, развернутых в Cloud Run. В этом уроке я проведу вас по этапам развертывания модели Llama 3.1 большой языковой модели (LLM) с параметрами 8B на сервисе облачного прогона на основе графического процессора. Мы будем […]