Microsoft Photosynth

Microsoft Photosynth

Microsoft Live Labs haben etwas Interessantes wenn auch in meinen Augen wenig Sinnvolles an den Start gebracht: Photosynth.

Das ist die Oberfläche von Microsoft Photosynth.

Das ist die Oberfläche von Microsoft Photosynth, die nur mit der Maus bedient wird.

Im Prinzip soll die Software die eigenen Bilder auf der Festplatte mit beliebigen Bildern aus dem Internet abgleichen. Wenn nun eine Übereinstimmung bei einem abgebildeten Objekt gefunden wurde, wird anscheinend die räumliche Komponente dazu errechnet um die Perspektive festzustellen, aus der es aufgenommen wurde. Nun kann man um virtuelle 3D-Gebäude umherfliegen und die Bilder sind dann genau an der Stelle, wo sie perspektivisch korrekt sein müssten. Das sieht in Bewegung absolut cool aus aber wo der Nutzen für die Menschheit dahinter steckt, ist mir ein Rätsel. Google Earth ist da schon um einiges sinnvoller und dieses Video vom Multi-Touch Interaction Environment viel cooler.

14 Kommentare

  1. Marc sagt:

    Also das Video funktioniert einwandfrei. Ist ja bei Google gehostet. =)

    Ja, also ich teile deine Meinung absolut, dass es absolut unrealistisch ist, dass die Software mit x-beliebigen Fotos funktioniert, die auch noch aus dem Internet in den unterschiedlichsten Qualitätsstufen.

  2. Alain sagt:

    Also das automatisches Zusammenfügen und “Alignieren” von Bilder zumindest in vielen Fällen funktioniert sollte jedem klar sein, der bereits mal Panorama-Bilder erstellt hat.

    Dass das bei Text schwieriger ist wundert mich nicht, da man da mit wesentlich weniger Daten arbeiten kann (s/w Striche vs. vollfarbige Bilder).

  3. Marc sagt:

    Ne Alain. Die sagen ja, dass die nicht nur korrekt aneinander gepackt werden SONDERN, dass ein 3D Modell erzeugt wird, in dem man rumfliegen kann so dass die Ansichten dann auch noch räunlich korrekt passen. Das andere ist mir klar.

  4. @Alain: Diese stitcher nehmen aber meines Wissens nicht x-beliebige Bilder und suchen sich die heraus, die passen könnten, sondern man muss als Fotograf schon recht kooperativ sein. Wenn ich das Tutorial zu Hugin richtig gelesen habe, muss man gemeinsame Punkte in den Bildern markieren, das macht die Software nicht automatisch. Das MS-Video erweckt den Eindruck, dass einfach Bilder aus dem Netz genommen werden, ohne irgendwelche Zusatzinformation, wann, wo, wie und womit sie gemacht wurden. Das hätte schon eine ganz andere Qualität.

    An sich würde ich Text-Alignment für deutlich leichter halten als Bild-Alignment (von den Algorithmen, vom Speicher- und Zeitbedarf). Mein Verweis auf die Genetik sollte klar machen: In einem typischen Sequenzierungs-Projekt hat man Hunderttausende bis Millionen von Text-Schnippseln, von denen man weiß, dass sie alle zu einem Genom gehören. Man kann die gesuchte Gesamtsequenz mit heutigen Verfahren ganz gut rekonstruieren, wenn sie nicht zu groß ist. Nimm Bilder statt Text, und lasse die Randbedingung fallen, dass die Schnippsel in irgendeiner Beziehung zueinander stehen müssen. Ich denke, das Problem, das Du dann hast, läßt sich nicht so leicht lösen, wie MS es uns hier weismachen will.

    @Marc: Dein Glaube an Google ist wohl unerschütterlich, was? Ja inzwischen habe auch ich mir das Google-Video ansehen können (ist tatsächlich leicht unterschiedlich zu dem bei youtube).

  5. Alain sagt:

    @Jörn: Also ich gehe davon aus, dass Text-Schnipsel zusammenfügen und ähnliche Bilder finden einfach komplett andere Probleme sind.

    Bei ersterem kann man Brute-Force mal einfach alle möglichkeiten austesten und schauen ob etwas sinniges bei rauskommt. Die Laufzeit hält man niedrig indem man “schräge” Zusammensetzungen direkt ausschließt. Das analoge Premiere Signal wurde ja auch “geknackt” indem einfach alle Zeilen des Bildes neu sortiert wurden.

    Bei Bildern sucht man sich bestimmte “Features” (Farbübergänge, einzelne Spots, etc) und vergleicht diese dann mit den anderen Bildern. Gesichtserkennung (also ob ein Gesicht in einem Bild vorhanden ist, nicht ob ein Gesicht das selbe ist) funktioniert schon seit einiger Zeit in Echtzeit bei 30s in guter Auflösung. Ob ich jetzt nach den “Features” meines Bildes, oder den Features eines Gesichtes suche ist sicherlich nicht DER extreme Unterschied.

    Und zu Hugin: Entweder macht man das dort manuell oder man nutzt autopano, welches einem automagisch diese Punkte sucht (was aber nicht wirklich immer optimal läuft oder auch mal gar nicht).

    Ich sage nicht, dass das alles nicht etwas schönes neues ist, denn in der Art kombiniert habe ich soetwas definitiv noch nicht gesehen. Ich glaube aber nicht dass Winzigweich das momentan halbwegs performant hinbekommt. Aber wenn die Vaporware in ein paar Jahren wirklich auf den Markt kommt sind die Rechner wahrscheinlich inzwischen stark genug, denn sie haben alle 4-5 Cell Prozessoren intus.

Schreibe einen Kommentar


Marc installiert Internet Studium Google Marc trifft Essen Marc studiert Eigene Filme PC Spiele Spielkunst PlayStation 2 XBOX 360 Marc erklärt Reviews Ausgewählte Artikel art directed blogging Musik Videospiele XBOX Arcade Hardware Marc spielt Reisen Marc nervt Videoproduktion Uni Marc erlebt Marc guckt PlayStation Portable Reportagen RPG Videos