La tecnología de visión por computadora y el aprendizaje automático han llevado a un gran desarrollo en la estimación de la posición humana en 2D y 3D utilizando cámaras RGB, LiDAR y radares. Sin embargo, la estimación de la posición humana a partir de imágenes se ve afectada por la oclusión y la iluminación, lo cual es común en muchos escenarios de interés. Por otro lado, las tecnologías LiDAR y radar requieren hardware especializado y son costosas y consumidoras de energía. Además, su colocación en áreas no públicas genera preocupaciones significativas de privacidad.
En un estudio, han desarrollado una red neuronal profunda que mapea la fase y la amplitud de las señales WiFi a coordenadas UV dentro de 24 regiones del cuerpo humano. Utilizando técnicas de aprendizaje automático para entrenar un modelo y mejorar su rendimiento, como la utilización de la fase CSI, la adición de una rama de detección de puntos clave y el aprendizaje por transferencia a partir de un modelo basado en imágenes. Los resultados del estudio muestran que el modelo es capaz de estimar la posición densa de varios sujetos utilizando solo señales WiFi como entrada, con un rendimiento comparable a los métodos basados en imágenes. Aunque los resultados son prometedores, todavía hay limitaciones en el campo de la percepción WiFi basada, especialmente en diferentes diseños. En trabajos futuros, planeamos recolectar datos de diseños múltiples y extender nuestro trabajo para predecir formas de cuerpo 3D a partir de señales WiFi.
En lugar de entrenar un modelo WiFi desde cero, han explorado la información de supervisión rica para mejorar tanto el rendimiento como la eficiencia del entrenamiento. Aunque todavía hay limitaciones en el campo de la percepción WiFi basada, estamos confiados en que el trabajo futuro y la recolección de datos de diseños múltiples nos ayudarán a superar estas limitaciones.
Para mi, la parte interesante es que este estudio también ilustra cómo los sistemas de aprendizaje automático son capaces de aprovechar diferentes tipos de sensores y señales para resolver problemas para los que no se habían diseñado originalmente. Esto es especialmente importante en el campo de la robótica y la automatización, donde los sensores especializados pueden ser costosos y/o generar preocupaciones de privacidad. En el futuro, se espera ver más aplicaciones de aprendizaje automático que aprovechen la capacidad de los sensores comunes para resolver problemas complejos.