Un Anillo para gobernarlos a todos. Un Anillo para encontrarlos,
un Anillo para atraerlos a todos y atarlos en las tinieblas.
Así empezaba el famoso libro de J.R.R. Tolkien: El señor de los anillos y de esta frase algo tenebrosa se puede extraer un concepto muy importante y es que en muchas ocasiones un simple objeto puede tener mucha fuerza y ser más importante que muchos (de haber habido más anillos el poder hubiera estado más equilibrado). Dejándonos de abstracciones y de finales fatídicos hoy vengo a recalcar que justamente eso es lo que le falta a la neurociencia hoy día, no, un anillo no, sino un estándar.
Actualmente los
datos que son utilizados en los experimentos de neurociencia provienen de un
amplio abanico de herramientas que
almacenan la información de forma distinta y esta es analizada de forma
distinta. Esto causa que aunque los datos sean correctos sean de difícil de
replicar y de entender. Pero no solo ocasionan estos dos factores, que ya de
por si son bastante importantes, sino que prácticamente imposibilita el
compartir los datos pues para poder trabajar con estos debes estar
familiarizado con el equipo, lo que prácticamente supondría estar en el mismo
laboratorio de donde salieron.
En el campo de la bioinformática aplicada a la
genética resolvieron este problema generando un estándar, un formato común,
como los .txt o los .jpg que ves en tu ordenador. Este estándar es llamado
fasta y ello ha posibilitado la aparición de grandes almacenes online con los datos
en bruto de secuenciación que se han utilizado en experimentos reales. La
apertura de estos datos ha supuesto una revolución y la aparición de infinitud
de herramientas que la comunidad científica puede poner a prueba con estos
datos y que en ocasiones nos han dado nuevas interpretaciones del experimento
original que habían sido pasadas por alto por los autores. Pero, Stop!, todo
esto suena genial ¿eh?, estaría muy bien poder lograr esto en el campo de la
neurociencia. Sí, pero el problema es que aún no hemos desarrollado ese
estándar que ha posibilitado este gran crecimiento en el campo de la bioinformatica.
Pero tranquilos, esta idea no es brillante y ya hay gente trabajando en ello
(al menos para una parte de la neurociencia). En particular la iniciativa se
centra en datos de fisiología celular y se llama: ¨Neurodata without Borders¨ (¿Neuro?,
¿Qué pasa con la Glia?, en fin…dejare de lado mi cruzada particular durante un
momento pues aún solo con las neuronas esta empresa es compleja, y más vale dar
un paso pequeño que saltar y tropezar).
Este proyecto está coordinado por por el CRCNS (Collaborative Research in Computational
Neuroscience), una de las pocas bases de datos donde puedes encontrar grabaciones en bruto de experimentos reales (basta con registrarse y te darán un pase para que te los descargues). En este proyecto participan cuatro instituciones: Buzsaki lab en NYU, Svoboda lab in Janelia Farm, Meister lab del Caltech y el instituto Allan. Bajo este nuevo formato pretenden almacenar la siguiente información:
Este proyecto está coordinado por por el CRCNS (Collaborative Research in Computational
Neuroscience), una de las pocas bases de datos donde puedes encontrar grabaciones en bruto de experimentos reales (basta con registrarse y te darán un pase para que te los descargues). En este proyecto participan cuatro instituciones: Buzsaki lab en NYU, Svoboda lab in Janelia Farm, Meister lab del Caltech y el instituto Allan. Bajo este nuevo formato pretenden almacenar la siguiente información:
- Grabaciones de datos en función del tiempo. Las variaciones de voltaje dentro de la célula por ejemplo.
- Imágenes en 5D. Esto quiere decir que usaran las típicas 3 dimensiones añadiéndole los diferentes marcadores fluorescentes y además el tiempo en los datos de microscopio confocal.
- Datos comportamentales. Esenciales pero que van a hacer que el formato pese como el solo si pretenden incluir el vídeo como dicen.
- Eventos Neurales. Potenciales de acción, cambios en la concentración interna de Ca2. En mi opinión puesto que estos datos se pueden extraer de las grabaciones de datos en función del tiempo se deberían dejar fuera del formato en bruto.
- Eventos comportamentales.
- Datos de estímulos
En resumen el
formato incluiría metadatos (variables experimentales), datos procesados, data intermedios
(entiéndase nivel de procesado, datos de posición, forma de las ondas, etc) y
todos los datos en bruto recolectados. Todo esto estaría basado en Neurolex,
una especie de lenguaje común (Ontología) para los datos neurocientíficos defendida por el NIF.
Viñeta publicada en xkcd.com |
Aunque me parece
una gran iniciativa le veo algo de pega al hecho de almacenar datos procesados
en el mismo formato. Me parece genial que estos datos también se hagan con un estándar
pero no me parece adecuado insertarlos dentro del mismo formato junto con los
datos en bruto, puede que yo esté equivocado pero al menos esto es lo que dan a
entender en la escasa información que hay en la página del proyecto. Además está
el problema de la viñeta (estoy seguro de que debe haber alguna iniciativa más
por ahí) y también es necesario que la
comunidad científica involucrada lo acepte. Este elemento es crucial y difícil de tratar pues, siendo
sinceros, la mayoría de los laboratorios húmedos no terminan de casar con la informática
y quizás la idea de compartir los datos (incluso después de haberlos
publicados) puede que aterre a más de uno. Sin embargo, incluso con todos estos
¨peros¨ veo un gran futuro en este proyecto y creo que la gente involucrada (He
hablado con un par de ellos) tiene las ideas muy claras y son gente muy capacitada.
Para acabar
también decir que no solo la aparición
de este estándar abrirá las puertas a la creación de bases de datos públicas
sino que además propiciará la expansión de la neurofisiología computacional fuera de los laboratorios pues
cualquier persona podrá descargar estos datos en su ordenador y comenzar a
trabajar con ellos. Esto seguramente
hará las delicias de todos aquellos neuro-culos inquietos que están aburridos
en esas típicas aburridas clases que abundan por la universidad. Al menos a mí
ya se me está haciendo la boca agua.
PD: Este proyecto
que por cierto está buscando colaboradores así que si alguien se anima que me
lo comunique y me tenga informado, intercambio información por cerveza.
NWB
NWB
No hay comentarios:
Publicar un comentario