Made O'Meter
Discover where a brand or product originates
LoRAX (LoRA Exchange) ist ein spezialisierter Open-Source-Inferenzserver, der entwickelt wurde, um viele feinabgestimmte Large Language Model (LLM) Adapter auf einer einzigen GPU bereitzustellen. Er wurde ursprünglich von Predibase entwickelt, um die rechnerischen Herausforderungen bei der effizienten Skalierung von feinabgestimmten Modellen zu bewältigen. Das Projekt basiert auf rustbasierenden Frameworks wie Hugging Face's Text Generation Inference (TGI).
Als Open-Source-Projekt erfolgt die 'Herstellung' oder Entwicklung global durch Community-Beiträge, obwohl die primäre kommerzielle Triebkraft und Wartung von Predibase in den Vereinigten Staaten ausgeht. Es erlaubt Entwicklern, LoRA-Adapter dynamisch mit minimalen Latenzüberkopf zu wechseln, wodurch es zu einem Grundpfeiler für Unternehmen wird, die spezifische KI-Modelle ohne massive Hardwareinvestitionen skalieren möchten.
Report a bug/Feedback
disclaimer
poweredBy