c't 10/2024
S. 150
Praxis
NAS verschlagwortet Fotos
Bild: KI Midjourney | Collage c‘t

Apropos

Lokale KI verschlagwortet Fotosammlung auf NAS

Fotos sind mit dem Smartphone schnell gemacht, werden immer aufgehoben, sind aber auf dem Familien-NAS kaum wiederzufinden. Eine lokale KI hilft Ihnen, sich in den Bilderbergen zurechtzufinden. Sie verschlagwortet Ihre Fotos anhand des Inhalts – direkt auf dem NAS ohne leistungsfähige Grafikkarte.

Von Ramon Wartala

Seit jedes Smartphone eine Digitalkamera hat, wird so viel geknipst wie noch nie. Doch wer mistet noch regelmäßig die Bilderflut aus? Stattdessen landen die Fotos auf dem PC oder dem heimischen NAS, wenn der Speicher des Smartphones voll ist. Wenn man sie nicht eh gleich der Cloud überantwortet. Wer die Kontrolle über seine Daten behalten will, organisiert private Bilder deshalb lieber selbst. Doch in den Fotobergen das eine zu finden, das man gerade braucht, ist allein aufgrund der schieren Menge ein Problem. Abhilfe verheißt eine KI, die Bilder analysiert und sie mit Schlagworten versieht.

Solche multimodale große Sprachmodelle (Large Language Models, LLM), die neben Text auch visuelle Inhalte verarbeiten können, bieten OpenAI, Google und andere Firmen an, üblicherweise in einem Abo-Modell. Diese zu nutzen würde aber neben den Kosten wiederum bedeuten, die eigenen Bilder aus der Hand zu geben. Mit LlaVA (Large Language Visual Assistant Modell) gibt es aber auch ein Open-Source-Modell, das aus einer Forschungskooperation von Microsoft mit den Universitäten Madison (Wisconsin) und Berkeley (Kalifornien) entstanden ist und das Sie vollständig lokal betreiben können.

Kommentare lesen (13 Beiträge)