Tech and Solve

¿Cómo abordar proyectos de inteligencia artificial? Primera parte

Por: Innovación Tech And Solve.
Estamos en el centro de una gran revolución apalancada en gran medida por la Inteligencia Artificial. Las empresas están invirtiendo en soluciones que la incluyan, las plataformas de educación virtual están volcándose a enseñar esta tecnología, Medellín ya es centro de la cuarta revolución industrial y cada vez son más comunes las grandes comunidades y eventos alrededor de esta temática.
Por estas y otras razones hace unos meses en Tech and Solve decidimos extender el uso de la Inteligencia Artificial, específicamente del Machine Learning (ML) a cada área de la compañía, con el fin de ofrecer mejores servicios a nuestros clientes y potenciar nuestros procesos internos.
Nuestra aplicación de ML hasta el momento había estado enfocada en proyectos de innovación: Tuvimos grandes avances en áreas como reconocimiento facial, Human Activity Recognition, creando soluciones en las que interactúan machine learning con Internet de las Cosas, y logros como que dos miembros de nuestro equipo estuvieran entre los ganadores de un reto nacional de visión por computador aplicada a carros autónomos.
Aún con estas experiencias, aplicar estos conocimientos en proyectos que beneficien los procesos de nuestra empresa y extender el uso de estas tecnologías a toda la organización, incluyendo personas con pocos conocimientos técnicos, ha sido un reto gigante.
Por eso, con este post iniciamos una serie de contenidos en los que narraremos nuestras experiencias y aprendizajes al transformar nuestra compañía en una orientada a los datos y al aprovechamiento de estos.
¿Cómo abordar un proyecto de Inteligencia Artificial?
El primer paso que te recomendamos no está necesariamente reservado a machine learning, sino que es parte fundamental de todo proyecto; debes responder ¿cuál es el problema que quiero resolver?
Esta pregunta es vital para generar valor con una solución. Incluso si estás desarrollando un piloto es importante seleccionar un dolor de la organización, pues solucionarlo implica lograr llamar la atención de las directivas y confianza en la tecnología que estás probando.
Si tu foco es ML, es importante acotar el dominio del problema. En la organización encontrarás problemas de diferente índole, con soluciones no relacionadas con ML. Por ello, nuestra aproximación propuesta es que la organización misma aprenda a identificar problemas que puedan solucionarse con ML.
Por ejemplo, para dar inicio a este abordaje en Tech and Solve, ejecutamos un proceso de formación interna en torno a machine learning, con un enfoque en la importancia de los datos y en que cada persona de la organización (técnica y no técnica), tuviera el conocimiento necesario para plantear proyectos de este tipo.
Este proceso consistió en charlas de conceptos generales y avanzados, talleres, webinars, posts y charlas específicas a cada área presentando casos relacionados con su contexto y con un nivel específico a sus conocimientos técnicos. Esta última opción resultó muy efectiva por el acercamiento directo a las personas, que en ocasiones se sienten ajenas a este tipo de temas; también porque toda la información es de interés para ellas y porque logramos entender sus problemas y analizar en conjunto posibles soluciones.
Una vez identificados los problemas de cada área, seleccionamos en cuál trabajar primero a partir de criterios como su impacto en la organización, posibilidad de lograr dicho impacto en el tiempo definido para el proyecto, entre otros criterios. Como mencionamos anteriormente, aún en el caso de un piloto nuestra sugerencia es buscar un caso de importancia para la organización; además, es más motivante para ti y tu equipo de trabajo.
Otra abordaje viable pero que no implantamos en nuestro piloto, es que tú seas quien identifique estos problemas y soluciones. Esta estrategia puede ser rápida, pero estarías creando dependencia de ti, y las demás personas no tendrán conocimiento ni entendimiento de ML y la importancia de los datos, lo cual en consecuencia dificultará extender el uso de esta tecnología-cultura a toda la organización.
¿Por qué son tan importantes los datos para el Machine Learning?
Los modelos de machine learning requieren datos en grandes cantidades, y además etiquetados, considerando modelos de aprendizaje supervisado. Estas condiciones difícilmente se cumplirán en una compañía que no ha sido orientada por los datos, que con una alta probabilidad es el caso de la tuya, y de la mayoría hoy en día.
Además de la falta de datos, es probable que tu formación y experiencia se haya enfocado en la construcción y aplicación de modelos de ML y no en la recolección de datos; su identificación, extracción, limpieza, etiquetado, etc.. porque por lo general no te debes preocupar por ellos: las plataformas educativas te entregan los datasets, igual las plataformas de retos como Kaggle, incluso hay datasets para soluciones de ciudad como es el caso de MEData, o para ciertos contextos como visión por computador hay cientos de imágenes disponibles para entrenar tu modelo.
Pero, ¿qué ocurre cuando te vas a enfocar en un problema particular de tu organización?
Nuestra realidad fue encontrarnos con serias dificultades para disponer de los datos, y mucho más para disponer de los necesarios. Serias dificultades son por ejemplo no tener dato alguno, o tenerlos pero no confiar en ellos porque no hay una cultura de mantenerlos al día, no tenerlos en nuestros repositorios sino de nuestros clientes, no tener suficientes para entrenar un modelo, y no tenerlos etiquetados.
Esta última situación es de suma importancia para tu presupuesto. No solo porque implica que no podrás entrenar tu modelo hasta tener los datos etiquetados lo cual aumentará la duración del proyecto, sino porque implica posiblemente la dedicación de personas haciendo dicho etiquetado, y dichas personas por lo general deben ser expertas; por ejemplo, no cualquiera puede etiquetar un lunar como cancerígeno.
Etiquetar también implica ser creativo. Por ejemplo Target deseaba predecir cuáles de sus clientes estaban en embarazo para hacerles ofertas especiales antes que estas decidieran buscar otra tienda. El caso es que estar o no en embarazo no es información de la cual dispongan normalmente las tiendas, y este era el caso de Target. Por ello, decidieron hacer programas especiales para sus clientes embarazadas con el fin de completar su dataset necesario para entrenar sus modelos predictivos.
Comenzar el camino en la inteligencia artificial puede ser un poco más complicado de lo que hemos visto en nuestras etapas de aprendizaje con la tecnología, pero es un camino sumamente motivante por sus retos y sus recompensas. En esta entrada quisimos contarte nuestra experiencia y dejarte algunas sugerencias de cómo recorrer este camino de una manera un poco más fácil.
Si quieres saber más sobre nuestra experiencia puedes escribirnos a innovacion@techandsolve.com.