¿Cómo abordar un proyecto de IA?: Primeros pasos

Estamos en el centro de una gran revolución apalancada en gran medida por la Inteligencia Artificial; las empresas están invirtiendo en soluciones que la incluyan, las plataformas de educación virtual están volcándose a enseñar esta tecnología, Medellín ya es centro de la cuarta revolución industrial y cada vez son más comunes las grandes comunidades y eventos alededor de esta temática.

Por estas y otras razones hace ya unos meses en Tech and Solve decidimos extender el uso de la IA, específicamente del Machine Learning (ML)  a cada área de la compañía, con el fin de ofrecer mejores servicios a nuestros clientes y potenciar nuestros procesos internos.

Nuestra aplicación de ML hasta el momento había sido enfocada en proyectos de innovación.  Tuvimos grandes avances en áreas como reconocimiento facial, Human Activity Recognition, creando soluciones en las que interactúan ML con Internet de las Cosas, y logros como dos miembros de nuestro equipo entre los ganadores de un reto nacional de visión por computador aplicada a carros autónomos.  Y sin embargo, a pesar de esas experiencias, aplicar estos conocimientos en proyectos que beneficien los procesos de nuestra empresa, y extender el uso de estas tecnologías a toda la organización, incluyendo personas con pocos conocimientos técnicos, ha sido un reto gigante, tal vez mayor que lo logrado hasta el momento.

Esta es la primera de una serie de posts en que narraremos nuestras experiencias y aprendizajes al transformar nuestra compañía para que sea orientada a los datos y el aprovechamiento de estos.

¿Qué problema quiero resolver?

El primer paso que te recomendamos no está necesariamente reservado a ML sino que es parte fundamental de todo proyecto; debes responder ¿cuál es el problema que quiero resolver?

Esta pregunta es vital para generar valor con una solución; incluso si estás desarrollando un piloto es importante seleccionar un dolor de la organización, pues solucionarlo implica lograr llamar la atención de las directivas y confianza en la tecnología que estás probando.

Si tu foco es ML, es importante acotar el dominio del problema.  En la organización encontrarás problemas de diferente índole, con soluciones no relacionadas con ML.  Por ello, nuestra aproximación propuesta es que la organización misma aprenda a identificar problemas que puedan solucionarse con ML.  Para ello, en Tech and Solve hicimos un proceso de formación en torno a ML, con un enfoque en la importancia de los datos y en que cada persona de la organización, técnica y no técnica, tuviera el conocimiento necesario para plantear proyectos de ML.  Este proceso consistió en charlas de conceptos generales y avanzados, talleres, webinars, posts y charlas específicas a cada área presentando casos relacionados con su contexto y con un nivel específico a sus conocimientos técnicos. Esta última opción resultó muy efectiva por el acercamiento directo a las personas, que en ocasiones se sienten ajenas a este tipo de temas; también porque toda la  información es de interés para ellas y porque logramos entender sus problemas y analizar en conjunto posibles soluciones.

Otra aproximación viable es que tú seas quien identifique estos problemas y soluciones.  La ventaja de esta estrategia es que puede ser rápida; las desventajas son que estás creando dependencia de ti, y las demás personas no tendrán conocimiento ni entendimiento de ML y la importancia de los datos, lo cual en consecuencia dificultará extender el uso de esta tecnología-cultura a toda la organización.

Una vez identificados los problemas de cada área, seleccionamos cuál problema trabajar primero a partir de criterios como su impacto en la organización, posibilidad de lograr dicho impacto en el tiempo definido para el proyecto, entre otros criterios.  Como mencionamos anteriormente, aún en el caso de un piloto nuestra sugerencia es buscar un caso de importancia para la organización; además, es más motivante para ti y tu equipo de trabajo.

Los Datos

Los modelos de machine learning requieren datos, en grandes cantidades, y además etiquetados, considerando modelos de aprendizaje supervisado.  Estas condiciones difícilmente se cumplirán en una compañía que no ha sido orientada por los datos, que con una alta probabilidad es el caso de la tuya, y de la mayoría hoy en día.

Además de la falta de datos, es probable que tu formación  y experiencia se haya enfocado en la construcción y aplicación de modelos de ML y no en los datos; su identificación, extracción, limpieza, etiquetado, etc..  Esto principalmente porque por lo general no te debes preocupar por ellos: las plataformas educativas te entregan los datasets, igual las plataformas de retos como Kaggle, hay datasets para soluciones de ciudad como es el caso de MEData, o para ciertos contextos como visión por computador hay cientos de imágenes disponibles para entrenar tu modelo.  Pero, ¿para un problema particular de tu organización?

Nuestra realidad fue encontrarnos con serias dificultades para disponer de los datos, y mucho más para disponer de los necesarios. Serias dificultades son por ejemplo no tener dato alguno, o tenerlos pero no confiar en ellos porque no hay una cultura de mantenerlos al día, no tenerlos en nuestros repositorios sino de nuestros clientes, no tener suficientes para entrenar un modelo, y no tenerlos etiquetados.

Esta última situación es de suma importancia para tu presupuesto.  No solo porque implica que no podrás entrenar tu modelo hasta tener los datos etiquetados lo cual aumentará la duración del proyecto, sino porque implica posiblemente la dedicación de personas haciendo dicho etiquetado, y dichas personas por lo general deben ser expertas; por ejemplo, no cualquiera puede etiquetar un lunar como cancerígeno.

Etiquetar también implica ser creativo.  Por ejemplo Target deseaba predecir cuáles de sus clientes estaban en embarazo para hacerles ofertas especiales antes que estas decidieran buscar otra tienda.  El caso es que estar o no en embarazo no es información de la cual dispongan normalmente las tiendas, y este era el caso de Target.  Por ello, decidieron hacer programas especiales para sus clientes embarazadas con el fin de completar su dataset necesario para entrenar sus modelos predictivos.

Comenzar el camino en la Inteligencia Artificial puede ser un poco más complicado de lo que hemos visto en nuestras etapas de aprendizaje con la tecnología, pero es un camino sumamente motivante por sus retos y sus recompensas.  En esta entrada quisimos contarte nuestra experiencia y dejarte algunas sugerencias de cómo recorrer este camino de una manera un poco más fácil.   Si quieres saber más sobre nuestra experiencia puedes escribirnos a contact@techandsolve.com.

Compartir

Share on facebook
Share on twitter
Share on linkedin

Entradas relacionadas

¿Quieres recibir más información sobre tendencias en desarrollo de software, DevOps, innovación o productividad?

Últimas entradas