En los proyectos donde se diseña algo serio, hay decisiones que suenan triviales y que en realidad sostienen la mitad del producto. La orientación de la cámara de Abordo es una de esas. Apuntarla hacia abajo desde el techo del pasillo —en lugar de hacia los pasajeros como una cámara de seguridad tradicional— resuelve tres problemas al mismo tiempo: privacidad legal, calidad del conteo y costo de procesamiento. Vale la pena explicar el porqué porque ayuda a entender en qué se parece y en qué no se parece Abordo a un sistema de videovigilancia.
El reflejo equivocado
Cuando alguien escucha "vamos a poner una cámara en el bus", el reflejo intuitivo es imaginar una cámara que mira hacia los asientos, como las que están en metros o en algunos colectivos urbanos. Esa configuración tiene un propósito: registrar incidentes, identificar personas, dejar evidencia para investigaciones policiales o reclamos.
Para contar pasajeros, esa configuración es la peor opción posible. Y no por una sola razón.
Problema 1: oclusiones
Una cámara que mira horizontalmente al pasillo ve a las personas en perspectiva. La persona que va adelante tapa a la que va atrás. Si suben dos personas juntas, una empujando una maleta, el algoritmo de detección tiene que separar formas superpuestas en condiciones de iluminación variable. La tasa de error sube. El conteo se vuelve poco confiable.
Una cámara cenital, en cambio, ve a cada persona como una forma aislada desde arriba —una coronilla, dos hombros, los contornos. Casi no hay solape. Si dos personas suben juntas, sus coronillas son dos puntos distintos en la imagen, claramente separados. El detector de personas funciona dramáticamente mejor en esa configuración.
Esto no es opinión: es un resultado estándar de la literatura de visión por computador. El conteo cenital es la configuración recomendada para contar personas en pasillos, accesos y puertas.
Problema 2: privacidad
Una cámara horizontal captura rostros. Inmediatamente. Sin que nadie haya decidido nada, el dispositivo está tratando datos biométricos. Aunque el video se procese localmente, aunque se descarte después, aunque jamás se transmita: el sistema vio rostros. Eso, bajo la Ley 19.628 chilena y la nueva normativa de datos personales, lo mueve a una categoría regulatoria mucho más exigente.
La cámara cenital, geométricamente, no captura rostros. Capta coronillas, hombros y la parte superior de la cabeza. Identificar a una persona específica con esa imagen es extremadamente difícil incluso a propósito —y nuestro sistema ni siquiera lo intenta. El principio regulatorio que llamamos minimización —tratar solo los datos estrictamente necesarios para el fin— se cumple por construcción, no por política. La diferencia es enorme.
Para el operador esto se traduce en una afirmación poderosa: "esta cámara no identifica a nadie". Y a diferencia de la promesa equivalente con una cámara horizontal —donde el sistema podría identificar pero promete no hacerlo—, en la cenital la promesa es estructural.
Problema 3: economía del procesamiento
Una cámara que mira a un escenario complejo (asientos, ventanas, gente en perspectiva, equipajes en compartimentos) le da al modelo de IA un trabajo grande. Hay mucho que descartar antes de poder enfocar lo que importa. El modelo necesita ser más grande, el hardware más potente, el consumo eléctrico mayor.
La cámara cenital recorta drásticamente el escenario. Lo que ve es un pequeño rectángulo: el umbral de la puerta. Todo lo que aparece ahí es relevante para el conteo. Eso permite usar modelos más livianos, hardware más barato (Raspberry Pi 5 + Hailo-8L AI HAT de $73.000 + $64.000), y bajar el consumo a niveles compatibles con la red eléctrica auxiliar del bus.
Esa economía se traduce directamente en el precio que podemos ofrecer al cliente. Si necesitáramos un Jetson Orin Nano de varios cientos de dólares solo porque la cámara está mal orientada, el modelo comercial de Abordo no funcionaría.
La sutileza: dónde montar exactamente
Decir "cámara cenital" no es suficiente. La altura y el ángulo importan.
- Demasiado alta: la coronilla queda muy pequeña en la imagen, los detalles se pierden, el detector pierde precisión.
- Demasiado baja: el campo de visión se angosta, personas altas quedan parcialmente cortadas, el sistema cuenta mal cuando suben varias juntas.
- Ligeramente inclinada: si no es perfectamente perpendicular, vuelven los problemas de perspectiva.
La instalación calibra estas variables en cada bus. La altura típica que usamos está entre 2,10 y 2,30 metros, justo arriba del umbral, con la cámara perpendicular al piso. La línea virtual donde se cuenta el cruce queda marcada en el firmware después de la calibración.
¿Y la visión nocturna?
Buena parte de la operación interurbana ocurre en condiciones de iluminación pobre. Buses sin luces internas encendidas, rutas nocturnas, terminales con poca iluminación. Por eso la cámara que usamos tiene visión nocturna infrarroja (IR): un anillo de LEDs infrarrojos emite luz invisible al ojo humano, y la cámara la capta. Para el ojo de un pasajero, la cámara está apagada; para el modelo de IA, hay luz suficiente para detectar formas.
Esto resuelve dos problemas a la vez: el sistema funciona 24/7 sin depender de la iluminación del bus, y los pasajeros no perciben una luz molesta. El IR es invisible, no irritante.
¿Por qué no se les ocurrió antes?
A veces sí se les ocurrió. Sensores infrarrojos cenitales y cámaras cenitales existen en sistemas APC desde hace años. Lo que cambió es que la combinación de modelos de IA modernos (YOLO, ByteTrack) y hardware de borde barato hace ahora viable lo que antes requería equipos industriales muchas veces más caros. El conteo cenital es la mejor opción técnica desde siempre; recién hace poco es también la mejor opción económica.
Cierre
Una decisión que parece trivial —dónde apuntar la cámara— termina determinando si el producto es viable o no, si el cliente cumple con la ley sin esfuerzo o si tiene un problema legal latente, y si el negocio escala económicamente o no. En arquitectura técnica las pequeñas decisiones tempranas son las que sostienen todo lo demás.
El siguiente post de esta serie explica las dos piezas del modelo —YOLO y ByteTrack— en lenguaje sin tecnicismos. Si te interesa el detalle técnico, sigue por ahí.