FTDNA и Promethease

В начале года я заказывал тест ДНК в компании «Family Tree DNA», в интерпретации результатов компанией, к слову сказать, была ошибка, я ещё напишу об этом, когда история закончится.

Мне ещё тогда в комментариях подсказали сервис «Promethease», который за пять долларов может проанализировать полученные данные и что-то сказать вам по ним о вашем здоровье. К сожалению, ни тогда, ни сегодня заставить работать Promethease с полученными от FTDNA данными не получилось — сервис упорно писал и пишет, что формат ему не знаком.

Пришлось разбираться в чём же дело. В итоге проблему я победил, рецептом делюсь. Во-первых, вам потребуется файл с данными анализа вашей ДНК, я скачал его из раздела FamilyFinder, на скриншоте подчёркнутая красным ссылка внизу: FamilyFinder (22.66КиБ) Этот раздел находится на первой странице в том случае, если вы заказывали одноимённый тест.

В этом разделе у меня пять ссылок, я скачал файл по ссылке «Build 36 Autosomal Raw Data» и совершенно без понятия чем файлы по ссылкам различаются и подойдут ли оставшиеся, с этим я ещё не разбирался.

Далее файл надо распаковать, если ваш браузер ещё этого не сделал. Для этого под «Маком» и «Линуксом» можно воспользоваться утилитой командной строки gzip, а под Виндоузом его распаковывать умеет «WinRAR».

Внутри архива будет файл в формате CSV («значения, разделённые запятой»), его надо сконвертировать в формат 23andme при помощи небольшой утилиты, которую я написал. Лучше её не копировать через буфер обмена (в ней есть символы табуляции, которые важны и могут пропасть), а сохранить на компьютер браузером или как-то иначе.

Как запускать её под Виндоуз я не решусь рассказывать, как-то можно, но я на память не опишу этот процесс, больше пяти лет под этой ОС не работал, на «Маке» и «Линуксе» это делается из командной строки. Полностью процесс выглядит вот так:
# распаковываем архив
gunzip ftdna.csv.gz
# скачиваем утилиту
curl -O https://raw.githubusercontent.com/bolknote/shellgames/master/ftdnato23andme.sed
# делаем файл запускаемым
chmod a+x ftdnato23andme.sed
# конвертируем
./ftdnato23andme.sed < ftdna.csv > 23andme.txt
Получившийся файл 23andme.txt надо залить на Promethease, заплатить пять долларов и минут через двадцать (запросы на обработку данных ставятся в очередь) получите результат. У меня из целая куча «плохих новостей» (так и написано): повышенный риск облысения, 77% вероятности непереносимости лактозы, в три раза выше риск дегенерации мышц с возрастом и ещё ворох подобных «прелестей», «хороших новостей» тоже немало, но там чаще всего «вероятность получения рака простаты не выше нормы» и тому подобное, какие-то поддельные хорошие новости — не радуют.
9 декабря 2014 20:49

комментатор (инкогнито)
9 декабря 2014, 23:32

Это стандартное соотношение ("куча/немного").
Хотя читал, что есть одна нация практиковавшая близкородственные браки и за счет этого здорово почистившая генофонд. Это тамилы (вроде не все конечно, а какие-то более менее высокие касты). Статью/заметку ищите в подборке старого интересного у блоггера shvarz.

Такие тесты вместе с женой или кандидаткой в жены надо делать.

dinoelq (инкогнито)
9 декабря 2014, 23:43

А реальный прок от всего этого есть ?

Евгений Степанищев (bolknote.ru)
10 декабря 2014, 07:08, ответ предназначен комментатору

Хотя читал, что есть одна нация практиковавшая близкородственные браки и за счет этого здорово почистившая генофонд.
В каком смысле «почистившая»? Вымерли они что ли и более своей глупостью генофонд не загрязняют?

Евгений Степанищев (bolknote.ru)
10 декабря 2014, 07:09, ответ предназначен dinoelq

А реальный прок от всего этого есть?
Изучать вопрос надо. Там объём огромный, я ещё не разобрался.

комментатор (инкогнито)
10 декабря 2014, 08:23

1. "Почистившая" означает, что у тамилов, которых изучали вредных мутаций в результате близкородственных браков не больше, а наоборот меньше. Это все, что я знаю. Источник - известный вирусолог shvarz. Первоисточник ищите сами. (Мое предположение, что в исследованиях участвовали только высшие касты, восходящие к совсем совсем маленькому пулу случайно оказавшихся здоровыми людей, а селекция всего, что все таки было и в начальном пуле, шла в результате стандартных для экваториального средневековья причин.)

2. "Сиюминутный прок" следующий:
а) Логическое обоснование интуитивного "я хочу именно так!" - думаю для большинства программистов типа Болка, который пристегивается и на заднем сиденье, это актуально.
б) Меня вот на собеседование в 23andme особым порядком напрямую от менеджера пригласили. :) Как именно, не скажу, чтобы не ломать людям процесс отсева, но связано с тем, что у меня там профайл есть. (Правда от приглашения особого толка нет, поскольку они визы не спонсируют, а удаленщиков не берут.)
в) Некоторые открытия действительно позволяют в целом оптимизировать жизненные процессы.

Евгений Степанищев (bolknote.ru)
10 декабря 2014, 08:55, ответ предназначен комментатору

Источник — известный вирусолог shvarz.
У него в журнале в комментариях можно прочитать, что это скорее чушь, чем правда: http://shvarz.livejournal.com/165520.html?thread=1554064#t1554064
думаю для большинства программистов типа Болка, который пристегивается и на заднем сиденье, это актуально
«И на заднем сиденье» — это вы знатно пошутили, чем заднее сиденье такое особенное? Вот вам ролик на тему: https://www.youtube.com/watch?v=fnK_2Mxp1Kw Где-то ещё было один, который наглядно показывает, как вылетающий с заднего сиденья пассажир, ломает шею впередисидящему.

Ну и я не программист. Я топ-менеджер.

комментатор (инкогнито)
10 декабря 2014, 08:57

Если нужны точные медицинские результаты доступные на сегодняшний день, то необходим анализ и от 23andme тоже. Ftdna не все находит.

Но если есть возможность подождать перед заведением детей лет 5 и хочется "пристегнуться по полной", то есть инсайдерская инфа от человека из Illumina о том, что полное секвенирование ДНК за вменяемые деньги (наверное около 1К) будет доступно в течение 5 лет.

Евгений Степанищев (bolknote.ru)
10 декабря 2014, 09:08, ответ предназначен комментатору

Ftdna не все находит.
Он вообще ничего не находит. Там просто нет никого медицинского анализа вовсе.

комментатор (инкогнито)
10 декабря 2014, 09:11

«И на заднем сиденье» — это вы знатно пошутили, чем заднее сиденье такое особенное?
Я не спорю.
Просто я регулярно контактирую с людьми, для которых даже мои "избыточные" меры предосторожности выглядят нелепыми.

Поэтому я немного более широко смотрю на то, что допустимо/приемлимо и что нет.

комментатор (инкогнито)
10 декабря 2014, 09:11

Он вообще ничего не находит.
Я имел в виду снипы, которые выдаются в результатах.

Евгений Степанищев (bolknote.ru)
10 декабря 2014, 09:17, ответ предназначен комментатору

Я имел в виду снипы, которые выдаются в результатах.
Можете подробно рассказать? Я не понимаю о чём вы.

комментатор (инкогнито)
10 декабря 2014, 09:39

Можете подробно рассказать? Я не понимаю о чём вы.
Я не знаю о формате ftdna, не покупал там ничего. Но 23andme сырые данные выдает в виде списка SNP (произносится, как "снип").
Я имел в виду это.

комментатор (инкогнито)
10 декабря 2014, 09:46

Можете подробно рассказать? Я не понимаю о чём вы.
Я изначально имел в виду, что разные компании выдают разный список снипов и чтобы иметь в своем списке снипов все, что можно определить на сегодняшний день за разумные деньги, то нужно покупать анализы от обоих.

Евгений Степанищев (bolknote.ru)
10 декабря 2014, 09:58, ответ предназначен комментатору

Ну, я знаю что такое «снип», просто не понимал что вы хотите сказать.
Я изначально имел в виду, что разные компании выдают разный список снипов
Неудивительно совершенно. Единого наименования снипов просто не существует. Так что разные компании могут давать одинаковый список снипов под разными именами.

praeivis (praeivis.lt)
10 декабря 2014, 09:59, ответ предназначен Евгений Степанищев (bolknote.ru):

Я топ-менеджер.
Cамое страшное что вы не шутите и на самом деле считаете себя топ менеджером...

Евгений Степанищев (bolknote.ru)
10 декабря 2014, 10:02, ответ предназначен praeivis (praeivis.lt):

А кем мне себя надо считать? Вроде я и по занимаемой должности и по выполняемым обязанностям в компании им и являюсь:
Топ-менеджмент (от англ. Top management) — группа руководителей организации высшего уровня иерархии, которые ежедневно несут ответственность за эффективное управление этой организацией.
https://ru.wikipedia.org/wiki/Топ-менеджмент

комментатор (инкогнито)
10 декабря 2014, 10:04

Дело не в названиях. Дело в количестве.
См. сравнительные чарты по ссылкам отсюда: http://www.isogg.org/wiki/List_of_DNA_testing_companies
Не знаю насколько это актуально, но там разные цифры по количеству анализируемых снипов даны.
Разница местами исчисляется тысячами и сотнями тысяч.

То есть списки от разных компаний будут содержать разные наборы данных.
И прометеаза будет выдавать по ним разные отчеты.

Я так думаю, но не знаю точно.

Евгений Степанищев (bolknote.ru)
10 декабря 2014, 10:09, ответ предназначен комментатору

У того же FTDNA куча соврешенно разных тестов, которые будут выдавать разные наборы снипов, потому что исследуются разные участки. Так что так напрямую нельзя сравнивать, по всей видимости.

комментатор (инкогнито)
10 декабря 2014, 11:33

На прометеазе, кстати, все регулярно обновляется. Ежедневно. Надо раз в полгода заходить и заново прогонять данные для отчета. (И в 23andme сырые данные тоже регулярно обновляются, так что перед прогоном на прометеазе их нужно отуда скачивать снова.)

Если есть серьезные медицинские опасения, то рекомендуется и чаще обновлять.
Цифра про "полгода" от тех саппорта прометеазы.

Евгений Степанищев (bolknote.ru)
10 декабря 2014, 12:00, ответ предназначен комментатору

Если есть серьезные медицинские опасения, то рекомендуется и чаще обновлять.
Я просто для интереса эти данные получил.
На прометеазе, кстати, все регулярно обновляется. Ежедневно.
Интересно, не знал. Попробую как-нибудь ещё раз загрузить.

комментатор (инкогнито)
11 декабря 2014, 22:52

Что еще интересного можно сделать с получившимся набором снипов?
На сайте 23andme есть форум, куда можно получить доступ просто по онлайновой регистрации без покупки тестирования.
И там была подборка где-то всех сторонних сервисов, куда можно снипы загружать.
Из самого интересного, что помню есть:
1. Сервис, позволяющий оценить насколько часто (по сравнению со среднестатистическим значением) ваши (ну, не конкретно ваши, а вообще) предки вступали в сексуальные отношения с родственниками. Искать по слову "inbred".
2. Всякие сервисы позволяющие составить программу спортивных тренировок по генотипу.

комментатор (инкогнито)
11 декабря 2014, 22:53

2. Всякие сервисы позволяющие составить программу спортивных тренировок по генотипу.
Искать по словам athletic и sport.

bolknote.ru (bolknote.ru)
12 декабря 2014, 07:08, ответ предназначен комментатору

Спасибо! :)

Ваше имя или адрес блога (можно OpenID):

Текст вашего комментария, не HTML:

Кому бы вы хотели ответить (или кликните на его аватару)