FTDNA и Promethease
В начале года я заказывал тест ДНК в компании «Family Tree DNA», в интерпретации результатов компанией, к слову сказать, была ошибка, я ещё напишу об этом, когда история закончится.
Мне ещё тогда в комментариях подсказали сервис «Promethease», который за пять долларов может проанализировать полученные данные и что-то сказать вам по ним о вашем здоровье. К сожалению, ни тогда, ни сегодня заставить работать Promethease с полученными от FTDNA данными не получилось — сервис упорно писал и пишет, что формат ему не знаком.
Пришлось разбираться в чём же дело. В итоге проблему я победил, рецептом делюсь. Во-первых, вам потребуется файл с данными анализа вашей ДНК, я скачал его из раздела FamilyFinder, на скриншоте подчёркнутая красным ссылка внизу:
Этот раздел находится на первой странице в том случае, если вы заказывали одноимённый тест.
В этом разделе у меня пять ссылок, я скачал файл по ссылке «Build 36 Autosomal Raw Data» и совершенно без понятия чем файлы по ссылкам различаются и подойдут ли оставшиеся, с этим я ещё не разбирался.
Далее файл надо распаковать, если ваш браузер ещё этого не сделал. Для этого под «Маком» и «Линуксом» можно воспользоваться утилитой командной строки gzip, а под Виндоузом его распаковывать умеет «WinRAR».
Внутри архива будет файл в формате CSV («значения, разделённые запятой»), его надо сконвертировать в формат 23andme при помощи небольшой утилиты, которую я написал. Лучше её не копировать через буфер обмена (в ней есть символы табуляции, которые важны и могут пропасть), а сохранить на компьютер браузером или как-то иначе.
Как запускать её под Виндоуз я не решусь рассказывать, как-то можно, но я на память не опишу этот процесс, больше пяти лет под этой ОС не работал, на «Маке» и «Линуксе» это делается из командной строки. Полностью процесс выглядит вот так:
# распаковываем архив
gunzip ftdna.csv.gz
# скачиваем утилиту
curl -O https://raw.githubusercontent.com/bolknote/shellgames/master/ftdnato23andme.sed
# делаем файл запускаемым
chmod a+x ftdnato23andme.sed
# конвертируем
./ftdnato23andme.sed < ftdna.csv > 23andme.txt
Получившийся файл 23andme.txt надо залить на Promethease, заплатить пять долларов и минут через двадцать (запросы на обработку данных ставятся в очередь) получите результат. У меня из целая куча «плохих новостей» (так и написано): повышенный риск облысения, 77% вероятности непереносимости лактозы, в три раза выше риск дегенерации мышц с возрастом и ещё ворох подобных «прелестей», «хороших новостей» тоже немало, но там чаще всего «вероятность получения рака простаты не выше нормы» и тому подобное, какие-то поддельные хорошие новости — не радуют.
Это стандартное соотношение («куча/немного»).
Хотя читал, что есть одна нация практиковавшая близкородственные браки и за счет этого здорово почистившая генофонд. Это тамилы (вроде не все конечно, а какие-то более менее высокие касты). Статью/заметку ищите в подборке старого интересного у блоггера shvarz.
Такие тесты вместе с женой или кандидаткой в жены надо делать.
А реальный прок от всего этого есть ?
Комментарий для комментатор:
В каком смысле «почистившая»? Вымерли они что ли и более своей глупостью генофонд не загрязняют?
Комментарий для dinoelq:
Изучать вопрос надо. Там объём огромный, я ещё не разобрался.
а) Логическое обоснование интуитивного «я хочу именно так!» — думаю для большинства программистов типа Болка, который пристегивается и на заднем сиденье, это актуально.
б) Меня вот на собеседование в 23andme особым порядком напрямую от менеджера пригласили. :) Как именно, не скажу, чтобы не ломать людям процесс отсева, но связано с тем, что у меня там профайл есть. (Правда от приглашения особого толка нет, поскольку они визы не спонсируют, а удаленщиков не берут.)
в) Некоторые открытия действительно позволяют в целом оптимизировать жизненные процессы.
Комментарий для комментатор:
У него в журнале в комментариях можно прочитать, что это скорее чушь, чем правда: http://shvarz.livejournal.com/165520.html?thread=1554064#t1554064
«И на заднем сиденье» — это вы знатно пошутили, чем заднее сиденье такое особенное? Вот вам ролик на тему: https://www.youtube.com/watch?v=fnK_2Mxp1Kw Где-то ещё было один, который наглядно показывает, как вылетающий с заднего сиденья пассажир, ломает шею впередисидящему.
Ну и я не программист. Я топ-менеджер.
Если нужны точные медицинские результаты доступные на сегодняшний день, то необходим анализ и от 23andme тоже. Ftdna не все находит.
Но если есть возможность подождать перед заведением детей лет 5 и хочется «пристегнуться по полной», то есть инсайдерская инфа от человека из Illumina о том, что полное секвенирование ДНК за вменяемые деньги (наверное около 1К) будет доступно в течение 5 лет.
Комментарий для комментатор:
Он вообще ничего не находит. Там просто нет никого медицинского анализа вовсе.
Я не спорю.
Просто я регулярно контактирую с людьми, для которых даже мои «избыточные» меры предосторожности выглядят нелепыми.
Поэтому я немного более широко смотрю на то, что допустимо/приемлимо и что нет.
Я имел в виду снипы, которые выдаются в результатах.
Комментарий для комментатор:
Можете подробно рассказать? Я не понимаю о чём вы.
Я не знаю о формате ftdna, не покупал там ничего. Но 23andme сырые данные выдает в виде списка SNP (произносится, как «снип»).
Я имел в виду это.
Я изначально имел в виду, что разные компании выдают разный список снипов и чтобы иметь в своем списке снипов все, что можно определить на сегодняшний день за разумные деньги, то нужно покупать анализы от обоих.
Комментарий для комментатор:
Ну, я знаю что такое «снип», просто не понимал что вы хотите сказать.
Неудивительно совершенно. Единого наименования снипов просто не существует. Так что разные компании могут давать одинаковый список снипов под разными именами.
Комментарий для Евгения Степанищева:
Cамое страшное что вы не шутите и на самом деле считаете себя топ менеджером...
Комментарий для praeivis.lt:
А кем мне себя надо считать? Вроде я и по занимаемой должности и по выполняемым обязанностям в компании им и являюсь:
https://ru.wikipedia.org/wiki/%D0%A2%D0%BE%D0%BF-%D0%BC%D0%B5%D0%BD%D0%B5%D0%B4%D0%B6%D0%BC%D0%B5%D0%BD%D1%82
Дело не в названиях. Дело в количестве.
См. сравнительные чарты по ссылкам отсюда: http://www.isogg.org/wiki/List_of_DNA_testing_companies
Не знаю насколько это актуально, но там разные цифры по количеству анализируемых снипов даны.
Разница местами исчисляется тысячами и сотнями тысяч.
То есть списки от разных компаний будут содержать разные наборы данных.
И прометеаза будет выдавать по ним разные отчеты.
Я так думаю, но не знаю точно.
Комментарий для комментатор:
У того же FTDNA куча соврешенно разных тестов, которые будут выдавать разные наборы снипов, потому что исследуются разные участки. Так что так напрямую нельзя сравнивать, по всей видимости.
На прометеазе, кстати, все регулярно обновляется. Ежедневно. Надо раз в полгода заходить и заново прогонять данные для отчета. (И в 23andme сырые данные тоже регулярно обновляются, так что перед прогоном на прометеазе их нужно отуда скачивать снова.)
Если есть серьезные медицинские опасения, то рекомендуется и чаще обновлять.
Цифра про «полгода» от тех саппорта прометеазы.
Комментарий для комментатор:
Я просто для интереса эти данные получил.
Интересно, не знал. Попробую как-нибудь ещё раз загрузить.
Что еще интересного можно сделать с получившимся набором снипов?
На сайте 23andme есть форум, куда можно получить доступ просто по онлайновой регистрации без покупки тестирования.
И там была подборка где-то всех сторонних сервисов, куда можно снипы загружать.
Из самого интересного, что помню есть:
Искать по словам athletic и sport.
Комментарий для комментатор:
Спасибо! :)