Google, Facebook y Microsoft buscan muchos datos para alimentar y probar la técnica de aprendizaje para máquinas, deep learning, que es lo que le permite al software aprender a reconocer imágenes, determinar si alguien está enfermo a través una foto, entender el lenguaje, entre otras cosas.
Es una realidad que mucha de la información de las personas ya está flotando en la web y es fácil de conseguir, pero información sensible y usable para el sistema como imágenes médicas, entre otras cosas, es complicada de obtener y de ser compartida por las instituciones, esto por determinaciones legales y regulatorias.
El profesor de Cornell Tech, Vitaly Shmatikov, le dijo al MIT Technology Review que de cierta manera esto priva a las personas de los beneficios que les puede generar el deep learning.
¿Cómo darle la vuelta a esto? El deep learning utiliza unas especies de redes neuronales artificiales como parte de su funcionamiento, entonces si se pudiera entrenar y usar estos sistemas sin la necesidad de tener que englobar y darles la información sensible, los investigadores de Microsoft y Google creen que podrían hacer que el software sea más inteligente y convencer a las personas que cuidan estos datos para que se los proporcionen.
1
Por el momento Shmatikov, junto con otros individuos, están evaluando algo que llaman "privacy-preserving deep learning", que consiste en una forma de que las empresas y organizaciones como hospitales combinen sus datos y los presten en función de sólo entrenar al software.
De acuerdo al MIT Technology Review, Google ha inventado una forma de entrenar a los algoritmos de deep learning de la empresa utilizando datos como imágenes de smartphones sin la necesidad de transferirlas a la nube de la empresa, situación que podría poner a disposición datos que son difíciles de obtener. De acuerdo a la revista universitaria, Google no respondió a una solicitud para comentar sobre el tema.
Microsoft está utilizando la encriptación para empujar esta tecnología usando una técnica que les permite realizar operaciones matemáticas en datos encriptados y producir resultados también encriptados.
Kristin Lautner, quien lidera las investigaciones criptográficas de Microsoft, dice que cree que las CryptoNet (redes criptográficas) requieren más potencia que los software convencionales de aprendizaje, pero considera que la brecha es pequeña y que éstas podrían servir para un uso práctico en la vida diaria.
1