PoseTracker
Die PoseTracker-Lösung verwendet Deep Learning, um die Position und Orientierung von Objekten zu verfolgen. Bei dieser Lösung wird die Kamera Ihres Mobiltelefons verwendet, um den Winkel, die Ausrichtung und die Entfernung eines Gegenstandes in Echtzeit zu messen und zu verfolgen.
Erfahren Sie mehr zu PoseTracker
Die Notwendigkeit
Die korrekte Erfassung der Position, Orientierung und Identität eines Objekts ist eine große Herausforderung: Ohne vorherige Informationen, optische Daten oder Messungen kann es schwierig sein, Maßstab oder Entfernung zu messen und die Objekterkennung erfordert eine großes Dataset an deklarierten Daten.
Die Idee
Die CNN-Lösung (Convolutional Neural Networks) hat bedeutende Fortschritte bei der Erkennung, Klassifizierung und Segmentierung von Objekten gemacht, wie sie beispielsweise in autonomen Fahrzeugen verwendet werden. PoseTracker nutzt die Möglichkeiten von CNN zur Erkennung und Verfolgung von Objekten in 3D.
Die Lösung
PoseTracker verwendet einen patentierten Ansatz mit optischen Markern, um die Lage eines Objekts aus 2D-Bildern abzuleiten und verfolgt dann die Position ausgehend von einem Bild über alle nachfolgenden Bilder, basierend auf Vergleichen zu einer vorher definierten 3D-Orientierung.
Das komplexe Problem der Position
Die Verfolgung der variablen Entfernung und Position eines Objekts ist eine schwierige Aufgabe, die in der medizinischen Bildgebung, bei autonomen Fahrzeugen, in der Fertigung, bei Drohnen und vielen IoT-Anwendungen gelöst werden muss. PoseTracker ist ein gemeinschaftlicher Proof-of-Concept zur Lösung der 3D-Positionsbestimmung.
Technische Details zu PoseTracker
Die CNN-Lösung (Convolutional Neural Networks), eine Klasse von weitverzweigten neuronalen Netzen, hat in den letzten Jahren bedeutende Fortschritte in Bezug auf Objekterkennung, Klassifizierung und Segmentierung gemacht, was zu einer bedeutenden Entwicklung bei autonomen Fahrzeugen und einer Vielzahl von Anwendungen mit maschinellem Sehen geführt hat.
Es gab jedoch nur sehr wenige praktische Implementierungen dieser fortschrittlichen Ansätze zur Schätzung der Lage von 3D-Objekten. Die Fähigkeit, Objekte im 3D-Referenzraum zu erkennen und zu verfolgen, ist aufgrund mehrerer komplexer Fragen immer noch ein schwierig zu lösendes Problem:
- Die 3D-Lage ist schwer zu erfassen und erfordert komplizierte Anordnungen mit stereo-optischen oder magnetischen Ortungsgeräten.
- Fehlende Vorabinformation über das betreffende Objekt.
- Ein hinreichend großer, deklarierter Datensatz mit den richtigen Lageinformationen ist nur sehr schwer zu erhalten. Herkömmliche Bildbearbeitung, wie z. B. Achsendimensionierung und -transformationen, verändert unweigerlich die 3D-Lageinformationen.
Die Idee besteht darin, die Leistungsfähigkeit von CNN zu nutzen und eine Anwendung zur Erkennung und Verfolgung der Lage (Position und Ausrichtung) von 3D-Objekten mit einem patentierbaren optischen Marker zu implementieren, der es ermöglicht, die Rotation zu identifizieren und die Lage des Objekts abzuschätzen.
PoseTracker ist ein Proof-of-Concept für eine einfache, integrierte Pipeline zur Lageerkennung von Objekten im Raum mit Rotationsinformationen auf der Grundlage einer 3D-Lageverfolgungslösung (ein optischer Marker).
Die Anwendung analysiert 2D-Bilder einer Kamera, wobei die optische Markierung stets sichtbar ist. Die Anwendung, mit einem überwachten Training, erkennt den Marker und leitet dessen Orientierung von einem Bild auf alle nachfolgenden Bilder basierend auf dem Vergleich mit einer vordefinierten 3D-Orientierung ab.
Dieser abweichende Ansatz zur Lösung von PoseTracker-Problemen soll Ihnen in Zukunft helfen, die Kamera Ihres Mobiltelefons zu benutzen, um den Winkel, die Orientierung und die Entfernung eines Objekts in Echtzeit zu ermitteln.
Ressourcen:

Clean Water AI
Die KI-Lösung Clean Water AI nutzt Deep Learning, um Bakterien und schädliche Partikel im Wasser aufzuspüren. Das Gerät analysiert Trinkwasser mit Echtzeit-Erkennung und kartiert von Verunreinigungen.

Angel Eyes
Die Angel Eyes-Lösung ist ein IoT-Gerät, das die Schlafposition und die Umgebung eines Babys überwacht. Eltern können einen Live-Feed von überall her ansehen und Benachrichtigungen erhalten, wenn das Gerät Probleme feststellt.

Intelligent Robotics
Intelligent Robotics nutzt KI, um die Zusammenarbeit zwischen Menschen und Geräten zu verbessern. Microsoft AI ermöglicht es der neuen Generation von Robotern, sich an dynamische Situationen anzupassen und auf natürliche Weise mit Menschen zu kommunizieren.

AirSim – Drohnen
AirSim ist ein Simulationstool, das eine 3D-Version einer realen Umgebung erstellt. Eine Drohnensimulation „fliegt“, um Bilder zu erfassen und ein benutzerdefiniertes Ansichtsmodell zu erstellen. Die Künstliche Intelligenz nutzt dieses Ansichtsmodell, um Objekte oder Personen zu identifizieren.
Entdecken Sie die Möglichkeiten von KI
Starten Sie Ihre eigenen KI-Innovationen mit Schulungsressourcen und Entwicklungslösungen von Microsoft AI.

AI School
Erfahren Sie, wie Sie Ihre eigenen KI-Erfahrungen mit den KI-Technologie-Kursen erstellen können. Nehmen Sie an Lernpfaden zu den Themen dialogfähige KI, Machine Learning, KI für Geräte, Cognitive Services, autonome Systeme, professionelle KI-Strategien und verantwortungsvolle KI teil.

KI-Plattform
Beginnen Sie mit der Entwicklung von KI-Lösungen mit leistungsfähigen Tools und Diensten. Microsoft AI ist ein robustes Framework für die Entwicklung von KI-Lösungen in den Bereichen dialogfähige KI, Machine Learning, Data Sciences, Robotik, IoT und mehr.