Пишу, по большей части, про историю, свою жизнь и немного про программирование.

FTDNA и Promethease

В начале года я заказывал тест ДНК в компании «Family Tree DNA», в интерпретации результатов компанией, к слову сказать, была ошибка, я ещё напишу об этом, когда история закончится.

Мне ещё тогда в комментариях подсказали сервис «Promethease», который за пять долларов может проанализировать полученные данные и что-то сказать вам по ним о вашем здоровье. К сожалению, ни тогда, ни сегодня заставить работать Promethease с полученными от FTDNA данными не получилось — сервис упорно писал и пишет, что формат ему не знаком.

Пришлось разбираться в чём же дело. В итоге проблему я победил, рецептом делюсь. Во-первых, вам потребуется файл с данными анализа вашей ДНК, я скачал его из раздела FamilyFinder, на скриншоте подчёркнутая красным ссылка внизу:

FamilyFinder (22.66КиБ)

Этот раздел находится на первой странице в том случае, если вы заказывали одноимённый тест.

В этом разделе у меня пять ссылок, я скачал файл по ссылке «Build 36 Autosomal Raw Data» и совершенно без понятия чем файлы по ссылкам различаются и подойдут ли оставшиеся, с этим я ещё не разбирался.

Далее файл надо распаковать, если ваш браузер ещё этого не сделал. Для этого под «Маком» и «Линуксом» можно воспользоваться утилитой командной строки gzip, а под Виндоузом его распаковывать умеет «WinRAR».

Внутри архива будет файл в формате CSV («значения, разделённые запятой»), его надо сконвертировать в формат 23andme при помощи небольшой утилиты, которую я написал. Лучше её не копировать через буфер обмена (в ней есть символы табуляции, которые важны и могут пропасть), а сохранить на компьютер браузером или как-то иначе.

Как запускать её под Виндоуз я не решусь рассказывать, как-то можно, но я на память не опишу этот процесс, больше пяти лет под этой ОС не работал, на «Маке» и «Линуксе» это делается из командной строки. Полностью процесс выглядит вот так:

# распаковываем архив
gunzip ftdna.csv.gz
# скачиваем утилиту
curl -O https://raw.githubusercontent.com/bolknote/shellgames/master/ftdnato23andme.sed
# делаем файл запускаемым
chmod a+x ftdnato23andme.sed
# конвертируем
./ftdnato23andme.sed < ftdna.csv > 23andme.txt

Получившийся файл 23andme.txt надо залить на Promethease, заплатить пять долларов и минут через двадцать (запросы на обработку данных ставятся в очередь) получите результат. У меня из целая куча «плохих новостей» (так и написано): повышенный риск облысения, 77% вероятности непереносимости лактозы, в три раза выше риск дегенерации мышц с возрастом и ещё ворох подобных «прелестей», «хороших новостей» тоже немало, но там чаще всего «вероятность получения рака простаты не выше нормы» и тому подобное, какие-то поддельные хорошие новости — не радуют.

Ctrl ←Bashfuck
Ctrl →Bashfuck-2
23 комментария
комментатор 2014

Это стандартное соотношение («куча/немного»).
Хотя читал, что есть одна нация практиковавшая близкородственные браки и за счет этого здорово почистившая генофонд. Это тамилы (вроде не все конечно, а какие-то более менее высокие касты). Статью/заметку ищите в подборке старого интересного у блоггера shvarz.

Такие тесты вместе с женой или кандидаткой в жены надо делать.

dinoelq 2014

А реальный прок от всего этого есть ?

Евгений Степанищев (bolknote.ru) 2014

Комментарий для комментатор:

Хотя читал, что есть одна нация практиковавшая близкородственные браки и за счет этого здорово почистившая генофонд.

В каком смысле «почистившая»? Вымерли они что ли и более своей глупостью генофонд не загрязняют?

Евгений Степанищев (bolknote.ru) 2014

Комментарий для dinoelq:

А реальный прок от всего этого есть?

Изучать вопрос надо. Там объём огромный, я ещё не разобрался.

комментатор 2014
  1. «Почистившая» означает, что у тамилов, которых изучали вредных мутаций в результате близкородственных браков не больше, а наоборот меньше. Это все, что я знаю. Источник — известный вирусолог shvarz. Первоисточник ищите сами. (Мое предположение, что в исследованиях участвовали только высшие касты, восходящие к совсем совсем маленькому пулу случайно оказавшихся здоровыми людей, а селекция всего, что все таки было и в начальном пуле, шла в результате стандартных для экваториального средневековья причин.)
  1. «Сиюминутный прок» следующий:
    а) Логическое обоснование интуитивного «я хочу именно так!» — думаю для большинства программистов типа Болка, который пристегивается и на заднем сиденье, это актуально.
    б) Меня вот на собеседование в 23andme особым порядком напрямую от менеджера пригласили. :) Как именно, не скажу, чтобы не ломать людям процесс отсева, но связано с тем, что у меня там профайл есть. (Правда от приглашения особого толка нет, поскольку они визы не спонсируют, а удаленщиков не берут.)
    в) Некоторые открытия действительно позволяют в целом оптимизировать жизненные процессы.
Евгений Степанищев (bolknote.ru) 2014

Комментарий для комментатор:

Источник — известный вирусолог shvarz.

У него в журнале в комментариях можно прочитать, что это скорее чушь, чем правда: http://shvarz.livejournal.com/165520.html?thread=1554064#t1554064

думаю для большинства программистов типа Болка, который пристегивается и на заднем сиденье, это актуально

«И на заднем сиденье» — это вы знатно пошутили, чем заднее сиденье такое особенное? Вот вам ролик на тему: https://www.youtube.com/watch?v=fnK_2Mxp1Kw Где-то ещё было один, который наглядно показывает, как вылетающий с заднего сиденья пассажир, ломает шею впередисидящему.

Ну и я не программист. Я топ-менеджер.

комментатор 2014

Если нужны точные медицинские результаты доступные на сегодняшний день, то необходим анализ и от 23andme тоже. Ftdna не все находит.

Но если есть возможность подождать перед заведением детей лет 5 и хочется «пристегнуться по полной», то есть инсайдерская инфа от человека из Illumina о том, что полное секвенирование ДНК за вменяемые деньги (наверное около 1К) будет доступно в течение 5 лет.

Евгений Степанищев (bolknote.ru) 2014

Комментарий для комментатор:

Ftdna не все находит.

Он вообще ничего не находит. Там просто нет никого медицинского анализа вовсе.

комментатор 2014

«И на заднем сиденье» — это вы знатно пошутили, чем заднее сиденье такое особенное?

Я не спорю.
Просто я регулярно контактирую с людьми, для которых даже мои «избыточные» меры предосторожности выглядят нелепыми.

Поэтому я немного более широко смотрю на то, что допустимо/приемлимо и что нет.

комментатор 2014

Он вообще ничего не находит.

Я имел в виду снипы, которые выдаются в результатах.

Евгений Степанищев (bolknote.ru) 2014

Комментарий для комментатор:

Я имел в виду снипы, которые выдаются в результатах.

Можете подробно рассказать? Я не понимаю о чём вы.

комментатор 2014

Можете подробно рассказать? Я не понимаю о чём вы.

Я не знаю о формате ftdna, не покупал там ничего. Но 23andme сырые данные выдает в виде списка SNP (произносится, как «снип»).
Я имел в виду это.

комментатор 2014

Можете подробно рассказать? Я не понимаю о чём вы.

Я изначально имел в виду, что разные компании выдают разный список снипов и чтобы иметь в своем списке снипов все, что можно определить на сегодняшний день за разумные деньги, то нужно покупать анализы от обоих.

Евгений Степанищев (bolknote.ru) 2014

Комментарий для комментатор:

Ну, я знаю что такое «снип», просто не понимал что вы хотите сказать.

Я изначально имел в виду, что разные компании выдают разный список снипов

Неудивительно совершенно. Единого наименования снипов просто не существует. Так что разные компании могут давать одинаковый список снипов под разными именами.

praeivis (praeivis.lt) 2014

Комментарий для Евгения Степанищева:

Я топ-менеджер.

Cамое страшное что вы не шутите и на самом деле считаете себя топ менеджером...

Евгений Степанищев (bolknote.ru) 2014

Комментарий для praeivis.lt:

А кем мне себя надо считать? Вроде я и по занимаемой должности и по выполняемым обязанностям в компании им и являюсь:

Топ-менеджмент (от англ. Top management) — группа руководителей организации высшего уровня иерархии, которые ежедневно несут ответственность за эффективное управление этой организацией.

https://ru.wikipedia.org/wiki/%D0%A2%D0%BE%D0%BF-%D0%BC%D0%B5%D0%BD%D0%B5%D0%B4%D0%B6%D0%BC%D0%B5%D0%BD%D1%82

комментатор 2014

Дело не в названиях. Дело в количестве.
См. сравнительные чарты по ссылкам отсюда: http://www.isogg.org/wiki/List_of_DNA_testing_companies
Не знаю насколько это актуально, но там разные цифры по количеству анализируемых снипов даны.
Разница местами исчисляется тысячами и сотнями тысяч.

То есть списки от разных компаний будут содержать разные наборы данных.
И прометеаза будет выдавать по ним разные отчеты.

Я так думаю, но не знаю точно.

Евгений Степанищев (bolknote.ru) 2014

Комментарий для комментатор:

У того же FTDNA куча соврешенно разных тестов, которые будут выдавать разные наборы снипов, потому что исследуются разные участки. Так что так напрямую нельзя сравнивать, по всей видимости.

комментатор 2014

На прометеазе, кстати, все регулярно обновляется. Ежедневно. Надо раз в полгода заходить и заново прогонять данные для отчета. (И в 23andme сырые данные тоже регулярно обновляются, так что перед прогоном на прометеазе их нужно отуда скачивать снова.)

Если есть серьезные медицинские опасения, то рекомендуется и чаще обновлять.
Цифра про «полгода» от тех саппорта прометеазы.

Евгений Степанищев (bolknote.ru) 2014

Комментарий для комментатор:

Если есть серьезные медицинские опасения, то рекомендуется и чаще обновлять.

Я просто для интереса эти данные получил.

На прометеазе, кстати, все регулярно обновляется. Ежедневно.

Интересно, не знал. Попробую как-нибудь ещё раз загрузить.

комментатор 2014

Что еще интересного можно сделать с получившимся набором снипов?
На сайте 23andme есть форум, куда можно получить доступ просто по онлайновой регистрации без покупки тестирования.
И там была подборка где-то всех сторонних сервисов, куда можно снипы загружать.
Из самого интересного, что помню есть:

  1. Сервис, позволяющий оценить насколько часто (по сравнению со среднестатистическим значением) ваши (ну, не конкретно ваши, а вообще) предки вступали в сексуальные отношения с родственниками. Искать по слову «inbred».
  2. Всякие сервисы позволяющие составить программу спортивных тренировок по генотипу.
комментатор 2014
  1. Всякие сервисы позволяющие составить программу спортивных тренировок по генотипу.

Искать по словам athletic и sport.

Евгений Степанищев (bolknote.ru) 2014

Комментарий для комментатор:

Спасибо! :)