LLM Training

Sophos stellt neues Trainings-Framework zur Optimierung der LLMs zur Verfügung

Sophos stellt neues Trainings-Framework zur Optimierung der LLMs zur Verfügung

Training und Feinabstimmung der großen Sprachmodelle (LLMs)

Sophos stellt ein neues Open-Source-Framework vor, das speziell für das Training und die Feinabstimmung großer Sprachmodelle (LLMs) entwickelt wurde. Dieses Tool richtet sich an Unternehmen, die domänenspezifische Aufgaben automatisieren möchten, wie etwa Cybersicherheitsanalysen oder Incident Response, und greift auf die DeepSpeed-Bibliothek von Microsoft zurück.

Große Sprachmodelle bieten das Potenzial, Arbeitsabläufe erheblich zu erleichtern. Jedoch fehlt generischen LLMs oft das spezifische Wissen, um anspruchsvolle Aufgaben in spezialisierten Bereichen effektiv zu lösen. Selbst wenn sie mit Trainingsdaten angereichert wurden, die Cybersicherheitsressourcen enthalten, reicht dies häufig nicht aus, um die Anforderungen an aktualisiertes oder proprietäres Wissen zu erfüllen.

Um diese Lücke zu schließen, hat das SophosAI-Team ein Trainingsframework entwickelt, das es ermöglicht, LLMs effizient auf die Bedürfnisse von Sophos X-Ops abzustimmen. Durch den Einsatz von DeepSpeed können Modelle mit theoretisch Billionen von Parametern trainiert werden, wobei die Rechenleistung und GPU-Ressourcen optimiert werden. Das Framework steht als Open Source im GitHub-Repository von Sophos zur Verfügung.

Effizientes LLM-Training durch Open Source

Damit ein LLM firmenspezifisches Wissen erlernen und effektiv nutzen kann, ist ein umfassendes Training aller Modellparameter erforderlich – ein ressourcenintensiver Prozess. Sophos hat sein Trainingsframework in Python implementiert und speziell für den Einsatz mit Amazon Web Services (AWS) SageMaker angepasst. Das Framework ist jedoch flexibel genug, um auch in anderen Umgebungen eingesetzt zu werden.

Durch den Einsatz von DeepSpeed wird die Skalierung großer Trainingsaufgaben ermöglicht, unter anderem durch parallele Datenverarbeitung. Obwohl das Framework auf bestehenden Open-Source-Bibliotheken basiert, hat das SophosAI-Team die wichtigsten Komponenten integriert und nutzerfreundlich aufbereitet. Es kombiniert Training und beide DeepSpeed-Inferenztypen (DeepSpeed-Inferenz und ZeRO-Inferenz) in einem einzigen, konfigurierbaren Skript. Zudem war es das erste Tool seiner Art, das einen benutzerdefinierten Container für die aktuellste DeepSpeed-Version auf AWS SageMaker bereitstellt und verteilte Skripte ausführt.