Qué hacer con el raw data de tu test genético (la parte que casi nadie aprovecha)
Si te has hecho un test de ADN con MyHeritage, AncestryDNA, 23andMe, tellmeGen, 24Genetics o cualquier otra empresa, te han dado un informe. Bonito, con gráficos, con porcentajes, con colores.
Lo que probablemente no sabes es que detrás de ese informe hay un archivo. Un archivo de texto plano, de unos 15–20 megabytes, con entre 600.000 y 700.000 líneas. Cada línea es una posición concreta de tu ADN: un marcador genético (SNP), el cromosoma donde está, y las dos “letras” (alelos) que tú tienes en esa posición.
Ese archivo es tu raw data. Tus datos crudos. Y contiene mucha más información de la que el informe bonito de la empresa te enseña.
La mayoría de la gente no lo descarga. Y de los que lo descargan, la mayoría no sabe qué hacer con él. Yo fui de los segundos hasta que me puse a investigar. Te cuento lo que encontré.
Cómo descargar tu raw data
Cada empresa tiene su proceso, pero todos son parecidos: entras en tu cuenta, vas a la sección de ADN, y buscas una opción tipo “Descargar datos en bruto” o “Download raw DNA data”.
MyHeritage
Entra en tu perfil de ADN → menú de tres puntos o icono de configuración → “Descargar archivo de ADN en bruto”. Te da un archivo CSV comprimido en ZIP. Al descomprimirlo tienes un CSV con columnas: rsID (identificador del marcador), cromosoma, posición, y resultado (tus dos alelos).
tellmeGen
Entra en tu cuenta → sección de resultados → busca la opción de descarga de datos crudos. El formato puede variar (CSV o TXT). Verifica que el archivo incluya columnas de rsID, cromosoma, posición y genotipo.
24Genetics
Similar: dentro de tu perfil hay una opción de descarga del raw data. El formato es compatible con las herramientas externas principales.
AncestryDNA
Configuración de cuenta → sección de ADN → “Descargar datos de ADN en bruto”. Te piden confirmar la contraseña. El archivo tarda unas horas en generarse.
23andMe / TTAM
Si tienes cuenta activa: Configuración → “Descargar datos en bruto”. Tras la quiebra y la adquisición por TTAM, verifica que la opción sigue disponible y en qué condiciones.
Promethease: el segundo test que cuesta 12 dólares
Esta fue la primera herramienta que usé y la que más me sorprendió.
Promethease es un servicio que cruza tu raw data con SNPedia, una base de datos abierta y mantenida por la comunidad que vincula variantes genéticas con la literatura científica publicada. Subes tu archivo, pagas 12 dólares, y en unos minutos tienes un informe con cientos de variantes tuyas clasificadas por relevancia.
El informe no es bonito. Es denso, técnico, y al principio intimidante. Parece una hoja de cálculo con colores verdes (bueno), grises (neutro) y rojos (atención). Cada variante tiene un enlace a SNPedia donde puedes leer qué dice la ciencia sobre ella.

Lo que saqué de Promethease
Mi informe tenía unas 1.200 variantes con información asociada. De esas, la mayoría eran neutras o de impacto menor. Pero había cosas que me llamaron la atención:
Mi perfil farmacogenético. Cómo metabolizo ciertos medicamentos según mis variantes en los genes CYP. Eso no me lo daba MyHeritage.
Mi variante COMT. Ahí descubrí que soy worrier-worrier: las dos copias del perfil que se asocia a peor rendimiento bajo estrés alto pero mejor rendimiento bajo presión moderada y sostenida.
Mi variante MTHFR. La que afecta a cómo proceso el ácido fólico.
Y la variante MUC5B. El factor de riesgo genético más conocido para fibrosis pulmonar. Cinco veces más papeletas que la media. Esa fue la que más me hizo pensar.
Nada de eso aparecía en mi informe de MyHeritage. Estaba en el raw data, esperando a que alguien lo cruzara con la ciencia. Promethease hizo ese cruce por 12 dólares.
Cómo interpretar Promethease
Tres consejos que me habría gustado tener antes de abrir mi informe:
Primero, no te asustes con los rojos. Un marcador rojo no significa que vayas a enfermar. Significa que hay literatura que asocia esa variante con un riesgo mayor que la media. “Mayor que la media” puede ser 1,2 veces (casi irrelevante) o 5 veces (relevante). Mira la magnitud, no solo el color.
Segundo, busca las variantes con “magnitud” alta. Promethease asigna un número de magnitud a cada variante. Las de magnitud 3 o superior suelen ser las más relevantes. Las de magnitud 1–2 son interesantes pero rara vez cambian decisiones.
Tercero, lee SNPedia con calma. Cada variante tiene una página en SNPedia con enlaces a los estudios originales. Si algo te preocupa, lee el estudio. Muchos son pequeños, antiguos o no replicados. El contexto importa.
Analizar tu raw data con IA
Esto es lo que hice después de Promethease y lo que más me ha servido a largo plazo.
La idea es sencilla: cargas tu archivo de raw data (o los resultados de Promethease) en un modelo de lenguaje y le haces preguntas concretas. “¿Qué dice la literatura sobre mi variante rs1801133?” “Si soy metabolizador lento de CYP2D6, ¿qué medicamentos debería mencionar a mi médico?” “¿Hay relación entre mis variantes de MTHFR y mis niveles de homocisteína en las analíticas de sangre?”
No es un análisis clínico. Un modelo de lenguaje no es un genetista. Pero es un asistente de investigación que puede cruzar referencias, resumir papers, y ayudarte a entender qué dicen tus datos en contexto.
Cómo lo hice yo
Descargué mi raw data de MyHeritage. Lo convertí en un formato que el modelo pudiera procesar (básicamente un CSV limpio). Le di instrucciones sobre qué eran las columnas y cómo interpretar los alelos. Y empecé a preguntar.
También he usado Antigravity para filtrar mi código genético por temas: entrenamiento, longevidad, alimentación. Y cruzar esos filtros con los datos históricos de mis analíticas de sangre. Ver qué dice tu genoma al lado de lo que dicen tus análisis de los últimos años es otra capa de información que no te da ninguna plataforma de serie.
Lo que funciona y lo que no
Funciona bien para: entender qué significa una variante concreta, buscar estudios asociados, comparar lo que dice tu genoma con lo que dicen tus analíticas, generar preguntas concretas para llevar a tu médico.
No funciona bien para: diagnóstico (no es su función), predecir riesgos complejos con precisión (el modelo no tiene más información que los papers que ha leído), ni sustituir el criterio de un profesional.
Lo que sí hace es cambiar la calidad de la conversación que tienes contigo mismo y con tu médico. En vez de ir a la consulta diciendo “me preocupa el colesterol”, vas diciendo “soy portador de una variante en APOE que se asocia con respuesta alta a grasas saturadas, y mis últimas tres analíticas muestran LDL por encima de 130”. Eso es una conversación diferente.
Otras herramientas para analizar tu raw data
Además de Promethease y la IA, hay varias plataformas que aceptan tu raw data y te extraen información diferente:
GEDmatch
Gratuito. Orientado a genealogía. Amplía las coincidencias de ADN más allá de la base de datos de la empresa donde te hiciste el test. Si buscas parientes lejanos o tienes interés genealógico serio, es útil. No te da información de salud.
Genetic Genie
Gratuito. Se centra en dos áreas: metilación (genes MTHFR, MTR, MTRR, COMT, VDR) y detoxificación (CYP, GST, SOD). El informe es un resumen de una página con tus variantes y su estado (homocigoto, heterocigoto, normal). Útil como complemento rápido a Promethease.
Codegen.eu
Gratuito. Te da un informe rápido con variantes relevantes clasificadas por categoría. Menos profundo que Promethease pero más fácil de leer.
SelfDecode
De pago (suscripción mensual ~30–40$/mes). Interfaz más cuidada que Promethease. Te da recomendaciones de suplementación y hábitos basadas en tus variantes. El modelo de negocio es la suscripción, lo que puede o no gustarte. La interpretación es más digerida que Promethease pero menos transparente sobre las fuentes.
Sequencing.com
Acepta raw data de múltiples fuentes. Ofrece apps gratuitas y de pago que analizan diferentes aspectos de tus datos. Modelo tipo marketplace de análisis genético.
Limitaciones que conviene tener claras
Antes de que salgas corriendo a subir tu raw data a todas estas plataformas, un par de cosas:
No todo lo que sale es accionable
De las 1.200 variantes que me dio Promethease, unas 20–30 eran realmente relevantes para decisiones concretas. El resto era información interesante pero que no cambiaba nada en mi día a día. No te obsesiones con cada marcador rojo. Filtra por magnitud y por evidencia.
La ciencia cambia
Una variante que hoy se asocia con un riesgo puede reclasificarse mañana cuando aparezcan nuevos estudios. Lo que leas hoy en SNPedia puede no ser lo mismo que leas dentro de dos años. Es un campo en movimiento.
Privacidad
Cada plataforma a la que subes tu raw data tiene acceso a tus datos genéticos. Promethease fue adquirida por MyHeritage en 2019. GEDmatch es propiedad de Verogen (empresa forense). SelfDecode tiene servidores fuera de la UE. Léete la política de privacidad. Toma decisiones informadas sobre dónde subes tu información más personal.
No sustituye a un profesional
Si descubres algo que te preocupa, no te autodiagnostiques con ChatGPT. Ve a un genetista clínico. Las herramientas que te he contado aquí sirven para explorar, para aprender, y para llegar a la consulta médica con mejores preguntas. No para sustituir la consulta.
Mi flujo completo (por si te sirve de referencia)
Para que veas cómo encaja todo junto, este fue mi proceso:
- Me hice el MyHeritage por el árbol genealógico. 50€ en oferta.
- Descargué el raw data. Gratis.
- Lo subí a Promethease. 12 dólares. Ahí descubrí mi perfil farmacogenético, mi COMT, mi MTHFR, y mi MUC5B.
- Subí el raw data a Genetic Genie. Gratis. Me confirmó el perfil de metilación.
- Me construí un sistema con IA para hacer preguntas a mis datos y cruzarlos con mis analíticas de sangre.
- Con toda esa información, decidí dar el salto a un test DTC de salud más completo con otra empresa, para ver si un informe profesional me daba algo que el análisis propio no me estaba dando.
- Ahora me estoy haciendo el genoma completo.
Total del raw data: 12 dólares. Lo que aprendí con ello: más de lo que me dio el informe original de MyHeritage.
No digo que todo el mundo tenga que seguir este camino. Hay gente que prefiere el informe cerrado de una empresa y no quiere meterse a analizar datos crudos. Me parece bien. Pero si te pica la curiosidad y no te asusta abrir un CSV, el raw data es donde está el valor oculto de tu test.
Preguntas frecuentes
La mayoría sí: MyHeritage, AncestryDNA, 23andMe/TTAM, tellmeGen, 24Genetics. Algunas empresas más pequeñas o especializadas pueden no ofrecerlo. Antes de comprar un test, verifica que la empresa permite la descarga del raw data si eso te importa.
Promethease acepta formatos de la mayoría de empresas grandes: MyHeritage, AncestryDNA, 23andMe, FamilyTreeDNA, entre otras. El formato estándar es un CSV o TXT con columnas rsID, cromosoma, posición y genotipo. Si tu archivo tiene ese formato, debería funcionar.
Depende de la plataforma. Léete la política de privacidad de cada una antes de subir tu archivo. Promethease fue adquirida por MyHeritage. GEDmatch pertenece a una empresa forense. SelfDecode tiene servidores fuera de la UE. Si la privacidad es tu prioridad, sé selectivo con dónde subes tus datos.
No. Los modelos de lenguaje actuales pueden leer un CSV si se lo das como contexto. Le dices qué son las columnas, le preguntas sobre variantes concretas, y te responde en lenguaje normal. No necesitas saber Python ni estadística. Necesitas paciencia y ganas de leer.
Entre 5 y 15 minutos desde que subes el archivo hasta que tienes el informe. El pago (12 dólares) se hace antes de subir. El informe queda disponible online durante unas semanas y también puedes descargarlo.