Hi lebaron,
zwei Dinge vorab:
(1) Du hast Deine Fotos *nur* auf der Festplatte?! Keine Angst vor Crash und Verlust? Solltest Du noch Backups haben, wäre die Rekonstruktion der alten Struktur ja wohl ein Kinderspiel.
(2) Was heißt eigentlich, Dein Archiv sei Dir "um die Ohren geflogen"? Du hast noch die Dateien, aber die Verzeichnisse nicht mehr?? Oder lagen alle in einem Verzeichnis und wurden durch eine beschreibende Datei organisiert? Ließe sich die nicht wiederherstellen? Oder haben die Fotos wenigstens noch sinnvolle Zeitstempel, nach denen man sie sortieren und Ereignissen zuordnen könnte? Möglicherweise steckt noch verwertbare Info in den JPEG-Kommentaren? Das wäre alles wesentlich einfacher!
Zu Deiner eigentlichen Frage. Das scheint mir noch ein Feld zu sein, in dem ausgiebig geforscht werden muss. Wenn es ein Enduser-Tool gäbe (ist ja nicht auszuschließen), müsstest Du jedenfalls mit einer sehr großen Fehlerrate leben, so dass es am Ende vielleicht leichter ist, die Fotos anhand von Thumbnails manuell zu sortieren.
Was ich auf die Schnelle gefunden habe, ist
AutoAlbum von MS -- allerdings ein Forschungsprototyp, zu dem es keine Downloads zu geben scheint. Du könntest Dich freilich auch mal durch die Links wühlen, die Google zu Stichwörtern wie "image clustering" -- vielleicht hat da doch jemand mal ein bisschen Code veröffentlicht.
Oder Du versuchst es selbst. So grob kämen zwei Schritte auf Dich zu:
(1) Merkmalsextraktion. Man muss die Bilddaten zu möglichst aussagekräftigen Kennzahlen verdichten, auf die man im weiteren aufsetzen kann. Was Du mit Häufigkeiten von Farbwerten ansprichst, ließe sich bspw in Histogrammen fassen, die von einer Vielzahl von Programmen erzeugt werden können. Nur: Geben Histogramme schon hinreichend Auskunft über den Inhalt eines Bildes? Wohl kaum. Und genau da fängt es nämlich an, kompliziert zu werden.
(2) Clustern, sprich, Gruppen finden, deren Elemente sich möglichst ähnlich sind. Dazu gibt es (kaum erschwingliche) kommerzielle Software oder (tw eher unreife) Open Source Pakete wie
WEKA oder
Orange.
Ist ein hochinteressantes Thema; leider fehlt mir die Zeit, Dich da zu unterstützen. Aber schreib doch, wie Du weiter gekommen bist.