Expertos de la Universidad de Bristol han identificado los peligros que plantea el uso de métodos centrados en los datos para la ingeniería biológica, con el objetivo de que las futuras investigaciones sean más seguras.
El uso indebido potencial de los enfoques centrados en los datos en la biología sintética plantea un riesgo significativo. La facilidad de acceso a las herramientas de la ciencia de datos puede permitir que actores nefastos desarrollen agentes biológicos dañinos con fines como el bioterrorismo o para interrumpir intencionalmente los sistemas ecológicos.
Los hallazgos, publicados hoy en Synthetic Biology, sugieren etiquetas adicionales de peligro de datos que describen los riesgos relacionados con los datos en el área de la biología sintética.
- Precisión incierta de los datos fuente – La precisión de los datos subyacentes no se conoce, por lo que su uso puede llevar a resultados erróneos o introducir sesgos.
- Completitud incierta de los datos fuente – Los datos subyacentes tienen una completitud incierta y tienen valores faltantes que causan resultados sesgados.
- Integración de datos incompatibles – Se están utilizando datos de diferentes tipos y/o fuentes que pueden no ser compatibles entre sí.
- Capaz de causar daño ecológico – Esta tecnología tiene el potencial de causar un daño ecológico generalizado, incluso si se utiliza correctamente.
- Peligro experimental potencial – La traducción de la tecnología a la práctica experimental puede requerir precauciones de seguridad.
El trabajo es el resultado de una colaboración entre investigadores del Bristol Centre for Engineering Biology (BrisEngBio) y el Jean Golding Institute for Data Intensive Research.
Kieren Sharma, coautor y estudiante de doctorado que trabaja en IA para la modelización celular en la Escuela de Ingeniería Matemática y Tecnología dijo: “Estamos entrando en una era transformadora en la que la inteligencia artificial y la biología sintética convergen para revolucionar la ingeniería biológica, acelerando el descubrimiento de nuevos compuestos, desde medicamentos que salvan vidas hasta biocombustibles sostenibles.
“Nuestro estudio ha descubierto posibles riesgos asociados con los tipos específicos de datos que se utilizan para entrenar los últimos modelos de biología de sistemas. Por ejemplo, las inconsistencias en las mediciones de organismos vivos complejos y dinámicos y las preocupaciones sobre la privacidad que podrían comprometer la seguridad de los modelos de próxima generación entrenados con datos del genoma humano.”
El proyecto amplía el trabajo del proyecto Data Hazards (datahazards.com), que tiene como objetivo crear un vocabulario claro de los posibles peligros de la investigación en ciencia de datos.
La coautora y codirectora del proyecto Data Hazards, Dra. Nina Di Cara de la Escuela de Ciencias Psicológicas, explicó: “Tener un vocabulario claro de los peligros facilita que los investigadores piensen de forma proactiva sobre cuáles son los riesgos de su trabajo y les ayude a poner en práctica medidas de mitigación. También facilita la comunicación para las personas que trabajan en diferentes campos que a veces utilizan un lenguaje diferente para hablar de los mismos problemas.”
Para lograr estos vocabularios claros, la colaboración interdisciplinaria es esencial.
Dr. Daniel Lawson, Director del Instituto Jean Golding y Profesor Asociado de Ciencia de Datos en la Escuela de Matemáticas, señaló que: “A medida que los conjuntos de datos aumentan en magnitud y ambición, se desarrollan algoritmos cada vez más sofisticados para obtener nuevos conocimientos. Esta complejidad hace que un enfoque colaborativo sin silos para identificar y prevenir los daños posteriores sea esencial.”
Dr. Thomas Gorochowski, autor principal y Profesor Asociado de Ingeniería Biológica en la Escuela de Ciencias Biológicas, añadió: “La ciencia de datos está destinada a revolucionar la forma en que diseñamos la biología para aprovechar sus capacidades únicas para abordar los desafíos globales que abarcan la producción sostenible de materiales y combustibles hasta el desarrollo de terapias innovadoras. Las extensiones desarrolladas por nuestro equipo ayudarán a los bioingenieros a considerar y debatir los riesgos en torno a los enfoques centrados en los datos para su investigación y ayudarán a garantizar que los enormes beneficios de las soluciones biobasadas se materialicen de forma segura.”
El estudio fue financiado por la Royal Society, BBSRC y EPSRC, y contó con el apoyo del Bristol BioDesign Institute.
Artículo:
‘Peligros de los datos en la biología sintética’ de Natalie R Zelenka, Nina Di Cara, Kieren Sharma, Thomas E Gorochowski et al en Synthetic Biology.
Revista
Biología sintética
Método de investigación
Análisis de datos/estadísticos
Título del artículo
Peligros de los datos en la biología sintética
Fecha de publicación del artículo
8-Jul-2024