
Pruna AI, европейский стартап, который работал над алгоритмами сжатия для моделей искусственного интеллекта, делает свою структуру оптимизации открытым исходным кодом в четверг. Pruna AI создает структуру, которая применяет несколько методов эффективности, таких как кэширование, обрезка, квантование и дистилляция, к данной модели ИИ. «Мы также стандартизируем сохранение и загрузку сжатых моделей, применяя комбинации этих методов сжатия, […]