jueves, 2 de octubre de 2014

Uno para definirlo todo.


Un Anillo para gobernarlos a todos. Un Anillo para encontrarlos,
un Anillo para atraerlos a todos y atarlos en las tinieblas.

Así empezaba el famoso libro de J.R.R. Tolkien: El señor de los anillos  y de esta frase algo tenebrosa se puede extraer un concepto muy importante y es que en muchas ocasiones un simple objeto puede tener mucha fuerza y ser más importante que muchos (de haber habido más anillos el poder hubiera estado más equilibrado). Dejándonos de abstracciones y de finales fatídicos hoy vengo a recalcar que justamente eso es lo que le falta a la neurociencia hoy día, no, un anillo no, sino un estándar



Actualmente los datos que son utilizados en los experimentos de neurociencia provienen de un amplio abanico de herramientas que  almacenan la información de forma distinta y esta es analizada de forma distinta. Esto causa que aunque los datos sean correctos sean de difícil de replicar y de entender. Pero no solo ocasionan estos dos factores, que ya de por si son bastante importantes, sino que prácticamente imposibilita el compartir los datos pues para poder trabajar con estos debes estar familiarizado con el equipo, lo que prácticamente supondría estar en el mismo laboratorio de donde salieron. 

 En el campo de la bioinformática aplicada a la genética resolvieron este problema generando un estándar, un formato común, como los .txt o los .jpg que ves en tu ordenador. Este estándar es llamado fasta y ello ha posibilitado la aparición de grandes almacenes online con los datos en bruto de secuenciación que se han utilizado en experimentos reales. La apertura de estos datos ha supuesto una revolución y la aparición de infinitud de herramientas que la comunidad científica puede poner a prueba con estos datos y que en ocasiones nos han dado nuevas interpretaciones del experimento original que habían sido pasadas por alto por los autores. Pero, Stop!, todo esto suena genial ¿eh?, estaría muy bien poder lograr esto en el campo de la neurociencia. Sí, pero el problema es que aún no hemos desarrollado ese estándar que ha posibilitado este gran crecimiento en el campo de la bioinformatica. Pero tranquilos, esta idea no es brillante y ya hay gente trabajando en ello (al menos para una parte de la neurociencia). En particular la iniciativa se centra en datos de fisiología celular y se llama: ¨Neurodata without Borders¨ (¿Neuro?, ¿Qué pasa con la Glia?, en fin…dejare de lado mi cruzada particular durante un momento pues aún solo con las neuronas esta empresa es compleja, y más vale dar un paso pequeño que saltar y tropezar).

Este proyecto está coordinado por  por el CRCNS (Collaborative Research in Computational
Neuroscience
), una de las pocas bases de datos donde puedes encontrar grabaciones en bruto de experimentos reales (basta con registrarse y te darán un pase para que te los descargues). En este proyecto participan cuatro instituciones: Buzsaki lab en NYU, Svoboda lab in Janelia Farm, Meister lab del Caltech y el instituto Allan. Bajo este nuevo formato pretenden almacenar la siguiente información:


  • Grabaciones de datos en función del tiempo. Las variaciones de voltaje dentro de la célula por ejemplo.

  • Imágenes en 5D. Esto quiere decir que usaran las típicas 3 dimensiones añadiéndole los diferentes marcadores fluorescentes y además el tiempo en los datos de microscopio confocal.

  • Datos comportamentales. Esenciales pero que van a hacer que el formato pese como el solo si pretenden incluir el vídeo como dicen.

  • Eventos Neurales. Potenciales de acción, cambios en la concentración interna de Ca2. En mi opinión puesto que estos datos se pueden extraer de las grabaciones de datos en función del tiempo se deberían dejar fuera del formato en bruto.

  • Eventos comportamentales.

  • Datos de estímulos


En resumen el formato incluiría metadatos (variables experimentales), datos procesados, data intermedios (entiéndase nivel de procesado, datos de posición, forma de las ondas, etc) y todos los datos en bruto recolectados. Todo esto estaría basado en Neurolex, una especie de lenguaje común (Ontología) para los datos neurocientíficos  defendida por el NIF.

Viñeta publicada en xkcd.com

Aunque me parece una gran iniciativa le veo algo de pega al hecho de almacenar datos procesados en el mismo formato. Me parece genial que estos datos también se hagan con un estándar pero no me parece adecuado insertarlos dentro del mismo formato junto con los datos en bruto, puede que yo esté equivocado pero al menos esto es lo que dan a entender en la escasa información que hay en la página del proyecto. Además está el problema de la viñeta (estoy seguro de que debe haber alguna iniciativa más por ahí) y  también es necesario que la comunidad científica involucrada lo acepte. Este elemento es  crucial y difícil de tratar pues, siendo sinceros, la mayoría de los laboratorios húmedos no terminan de casar con la informática y quizás la idea de compartir los datos (incluso después de haberlos publicados) puede que aterre a más de uno. Sin embargo, incluso con todos estos ¨peros¨ veo un gran futuro en este proyecto y creo que la gente involucrada (He hablado con un par de ellos) tiene las ideas muy claras y son gente muy capacitada.

Para acabar también decir que  no solo la aparición de este estándar abrirá las puertas a la creación de bases de datos públicas sino que además propiciará la expansión de la neurofisiología  computacional fuera de los laboratorios pues cualquier persona podrá descargar estos datos en su ordenador y comenzar a trabajar con ellos. Esto  seguramente hará las delicias de todos aquellos neuro-culos inquietos que están aburridos en esas típicas aburridas clases que abundan por la universidad. Al menos a mí ya se me está haciendo la boca agua.

PD: Este proyecto que por cierto está buscando colaboradores así que si alguien se anima que me lo comunique y me tenga informado, intercambio información por cerveza.

NWB

 

No hay comentarios:

Publicar un comentario