Was sind Speaker Tracking und Auto Framing?

Egal, ob Sie während der COVID-XNUMX-Pandemie von zu Hause aus arbeiten oder Geschäftstreffen mit Menschen aus anderen Ländern abhalten, Entfernung ist keine Einschränkung mehr - dank fortschrittlicher Videokonferenz-Ausstattung. Videokonferenzkameras ermöglichen uns eine einfache Verbindung und machen die Kommunikation effizienter.

Durch den Einsatz von Videokonferenzkameras mit KI-Technologie ist jeder Besprechungsteilnehmer im Raum deutlich zu sehen und zu hören. Niemand muss sich Gedanken über die falsche Gestaltung machen, um entweder zu viele oder zu wenige Personen einzubeziehen. Dies liegt daran, dass die von uns verwendeten KI-gestützten Videokonferenzgeräte über Lautsprecherverfolgungs- und Auto-Framing-Funktionen verfügen.

Videokonferenzkameras können den Sprecher unabhängig von seinem Standort genau erfassen und rechtzeitig verfolgen, was das Ergebnis der Zusammenarbeit dieser beiden Funktionen ist. In diesem Artikel erklären wir ausführlich, was Speaker-Tracking ist und Videokonferenzkamera mit automatischer Bildeinstellung. 

Was ist Speaker-Tracking?

Sprechertracking bedeutet, dass die Kamera die Person identifiziert, die gerade im Raum spricht, und sich auf sie konzentriert, bis sie aufhört. Die Speaker-Tracking-Funktion macht die Videokonferenz flüssiger und jeder Teilnehmer kann den Ausdruck und die Körpersprache des Sprechers deutlich sehen, so als würde er vor Ihnen sprechen. 

Die Sprecherverfolgung bewirkt, dass die Kamera, wenn der Sprecher aufhört zu sprechen, einige Sekunden lang auf ihn fokussiert, bis sie einen neuen Sprecher erfasst, und die Kamera den Fokus auf den neuen Sprecher umschaltet. Wenn eine Weile niemand spricht, zoomt die Kamera automatisch heraus und rahmt das gesamte Team oder den Besprechungsraum ein.

Was ist erforderlich, damit das Sprecher-Tracking funktioniert? Für optimale Ergebnisse müssen Beamforming-Mikrofone und Kameras zusammenarbeiten. Das Mikrofon erkennt zunächst die Schallquelle und führt die Kamera dorthin, um sie zu fokussieren. Dann wird die Kamera je nach Position der Tonquelle physisch oder digital schwenken, neigen und zoomen. Egal, wie weit oder nah Sie an der Kamera sind, Sie können den gesamten Fokus im Raum haben, wenn Sie sprechen.

Die bisher verwendeten Videokonferenzkameras können auch den gesamten Konferenzraum und alle Teilnehmer erfassen, jedoch erscheinen die weit entfernten Teilnehmer auf dem Bildschirm sehr klein und können von der anderen Seite hinter dem nicht gesehen und gehört werden Bildschirm. Das ist es, was das Speaker-Tracking mit AI-Videofunktionen mit der aktuellen Technologie gelöst hat. Besonders in mittleren und großen Konferenzräumen ist die Situation sehr häufig. Videokonferenzkameras mit Sprecherverfolgung können dieses Problem lösen und allen Teilnehmern ermöglichen, eine reibungslose Videokonferenz auf Kinoniveau zu erleben, die Arbeitseffizienz zu verbessern und die Kommunikationskosten zu senken.

Wenn Sie sich anhand der reinen Textbeschreibung nicht vorstellen können, wie diese Funktion funktioniert, möchte ich Ihnen als Beispiel ein kostengünstiges Produkt auf dem Markt vorstellen. Nexvoo N110 ist eine All-in-One-Videobar mit einer 4K-UHD-Kamera, einem 120-Grad-FOV und einem Aufnahmeabstand von 6 Metern. 

Das N110 verwendet fortschrittliche KI-Algorithmen, um eine intelligente Sprecherverfolgung zu erreichen und sicherzustellen, dass jeder im Besprechungsraum gut erfasst und einbezogen werden kann. Feinere Details und strukturierte Bilder sorgen dafür, dass Sie während des Meetings mehr Spaß haben.

Was ist Autoframing?

Was ist Auto-Framing?

Auto Framing kombiniert Gesichtserkennung, einen Kompositionsalgorithmus nach dem Drittelprinzip und pixelweise Superauflösung, um aus dem Bild mit dem erkannten Gesicht ein Porträt mit der besten Komposition zu erstellen. Die Auto-Framing-Funktion erkennt automatisch alle Teilnehmer im Konferenzraum und passt die Kamera basierend auf der Anzahl und dem Standort der Teilnehmer mithilfe von Echtzeit-Gesichtserkennung und Standortverfolgung an, um jeden Teilnehmer in der Konferenz abzudecken. 

Wenn Sie beispielsweise das Nexvoo N109 verwenden, können Teilnehmer beim Betreten oder Verlassen des Beurteilungsbereichs erkannt werden. Wenn Sie allein im Besprechungsraum sind, hält die Auto-Framing-Funktion die Kamera auf Sie fokussiert und folgt Ihnen, sobald Sie Ihre Position ändern, um Sie in der Mitte des Bildes zu halten. Wenn Sie sich von der Vorderseite der Kamera in eine andere Ecke des Besprechungsraums bewegen, ändert die Kamera die Brennweite, um Sie in der Ecke zu erfassen und Sie in der Mitte des Bildschirms einzurahmen. 

Wenn ein neuer Teilnehmer hinzukommt, zoomt die Kamera heraus, um den neuen Teilnehmer einzuschließen. Dadurch wird vermieden, dass die Kamera, die bereits fertig eingestellt ist, bewegt wird, nur um die Ansicht mit allen Teilnehmern vollständiger zu machen. Die Auto-Framing-Funktion erhöht den Autofokus. Wenn Sie sich in einer Videokonferenz befinden, müssen Sie sich keine Gedanken über die Anpassung der Kamerawinkel machen und sich auf die Kommunikation konzentrieren.

Die Auto-Framing-Funktion für Videokonferenzgeräte kann auf Besprechungsräume unterschiedlicher Größe angewendet werden. In mittleren und großen Konferenzräumen erhöht die Auto-Framing-Funktion ab einer bestimmten Teilnehmerzahl den Erkennungsbereich, um mehr Teilnehmer zu erfassen. 

Sie können nicht erzwingen, dass alle Teilnehmer vollständig auf eine Position fixiert sind und einen festen Abstand zur Kamera einhalten, daher benötigen Sie die Auto-Framing-Funktion eines Lautsprecher-Tracking-Videokonferenzgeräts, um Sie aus dieser peinlichen Situation zu retten. In diesem Fall muss die Kamera eine längere Brennweite und einen größeren Weitwinkel haben, um die Teilnehmer in allen Positionen im Sichtfeld so gut wie möglich einzufangen. So kann beispielsweise Nexvoo N120, eine Dual-Cam-Videobar mit 6 Meter langer Brennweite und einem 120-Grad-Sichtfeld, Videokonferenzen in mittleren oder großen Konferenzräumen reibungslos ablaufen lassen.

Lautsprecher-Tracking und Auto-Framing arbeiten zusammen, um intelligentes Tracking zu erreichen

Obwohl das Sprecher-Tracking und die Auto-Framing-Funktionen unterschiedlichen Prinzipien unterliegen, sind sie nicht vollständig unabhängig und können kollaborativ arbeiten. Die Auto-Framing-Funktion ermöglicht eine sofortige Erfassung von Personen im Konferenzraum und erkennt ihren Standort in Echtzeit. Auf dieser Grundlage kann die Sprecherverfolgungsfunktion den Sprecher in Echtzeit identifizieren und den Rahmen vergrößern und den Sprecher in der Ansicht zentrieren. Genau wie Nexvoo N110 und N120 verfügen beide über Lautsprecher-Tracking und Auto-Framing. 

Der N120 ist ausgestattet mit Doppelkameras, eine lange Brennweite und ein ultraweites Sichtfeld. Es kann auch die Helligkeit automatisch entsprechend den Lichtverhältnissen optimieren und so effektiv verhindern, dass der Besprechungsraum zu dunkel wird. Durch den dadurch hervorgerufenen negativen Effekt werden die detaillierten Aktionen aller Teilnehmer im Konferenzraum für den anderen Teilnehmer deutlicher sichtbar.