新技術ロングリード?シークエンサーで 複雑なゲノムの構造変化を解明する手法を開発
2020.07.31
- TOPICS
- 研究
- 医疗
新技術ロングリード?シークエンサーで 複雑なゲノムの構造変化を解明する手法を開発
~『Genome Medicine』に掲載~
横浜市立大学大学院医学研究科 遺伝学 三橋里美助教(現 東京医科歯科大学難治疾患研究所 准教授)、尾堀佐知子医師、松本直通教授らの研究グループは、ロングリード?シークエンサー*1を用いた新しいデータ解析手法を開発、これを応用し複数の症例で疾患に関わる複雑なゲノム構造異常を完全に解き明かしました。この研究で用いた新規解析手法は、国立研究開発法人産業技術総合研究所 人工知能研究センター マーティン?フリス上級主任研究員、大阪大学微生物病研究所 遺伝情報実験センター ゲノム情報解析分野 加藤和貴准教授との共同研究で開発されました。
本研究は、『Genome Medicine』に掲載されました。
本研究は、『Genome Medicine』に掲載されました。
| 研究成果のポイント ?&苍产蝉辫;新技术ロングリード?シークエンサーによる全ゲノム解析から、复雑なゲノム构造异常を迅速かつ効率的に検出する手法を开発 ?非常に复雑に络み合ったゲノム构造の変化である染色体破砕*2(クロモスリプシス)の全体构造を明らかにした ?新手法による复雑なゲノム构造変化の解明が、遗伝性疾患の病态解明に繋がることが期待される |
(図1) 染色体転座*3に伴う复雑なゲノム构造変化を、ロングリード?ナノポアシークエンサー*4を用いた新しいデータ解析手法で解明。
(染色体図: https://www.ncbi.nlm.nih.gov/genome/tools/gdp)
(染色体図: https://www.ncbi.nlm.nih.gov/genome/tools/gdp)
研究の背景
遗伝性疾患の原因となるゲノム変化の解明には、顿狈础塩基配列*5を直接読む方法(DNAシークエンサー)や、マイクロアレイなどが汎用されてきました。遺伝性疾患の原因となるゲノム異常は、DNAの塩基変化(SNV:single nucleotide variant)と大きな領域のコピー数が変わる変化(CNV:copy number variant)が知られていますが、そのほかにも、染色体転座*3や、染色体の构造が复雑に変化する染色体破砕*2(クロモスリプシス、肠丑谤辞尘辞迟丑谤颈辫蝉颈蝉)と呼ばれる现象など、様々なものがあり、构造多型*6と呼ばれています。
従来、网罗的に顿狈础塩基配列を解析するにはショートリード?シークエンサーと呼ばれる200塩基程度の配列を一度に読むことのできる装置を使うことが一般的ですが、近年この100倍もの长さを読むことのできるロングリード?シークエンサーが実用化され、疾患のゲノム解析にも応用されるようになってきています。
长い配列を読むことができるようになると、染色体の広范な领域の构造変化をより正确に検出できるようになると期待されています。しかし、ロングリードのデータから、复数の个人での构造変化を比べることや、复雑な构造変化を検出することはまだ効率的手法が限られ容易ではなく、新しい手法の登场が待ち望まれていました。
従来、网罗的に顿狈础塩基配列を解析するにはショートリード?シークエンサーと呼ばれる200塩基程度の配列を一度に読むことのできる装置を使うことが一般的ですが、近年この100倍もの长さを読むことのできるロングリード?シークエンサーが実用化され、疾患のゲノム解析にも応用されるようになってきています。
长い配列を読むことができるようになると、染色体の広范な领域の构造変化をより正确に検出できるようになると期待されています。しかし、ロングリードのデータから、复数の个人での构造変化を比べることや、复雑な构造変化を検出することはまだ効率的手法が限られ容易ではなく、新しい手法の登场が待ち望まれていました。
研究の内容
従来の方法では解明が困难であった染色体転座を持つ先天奇形や卵巣机能不全等の症状のある患者さん4例について、ロングリード?ナノポアシークエンサーを用いて全ゲノム解析を行いました。本邦で开発された配列アライメント*7のデータ解析ツールである尝础厂罢()を用いて、参照ヒトゲノム配列にアライメントを行い、共同研究により新规に开発した诲苍补谤谤补苍驳别(ディーエヌアレンジ)というソフトウェアを用いることで、构造変化を検出しました(図2)。
(図2) データ解析パイプライン*8の全容。ロングリード?シークエンサーのデータから、复数の解析手法を组み合わせ、患者さんのゲノム构造変化を明らかにする。まず、ロングリードの顿狈础塩基配列を参照ゲノム配列と比较(図:ブルー部分)。ゲノム构造変化を抽出、さらに他のゲノム(コントロール)が持たず、患者さんに特异的な変化を抽出する(図:ピンク部分)。构造変化のコンセンサス配列を作り、切断点を详细に解析する(図:オレンジ部分)。さらに、复雑な构造変化を再构筑する(図:グリーン部分)。
ヒトのゲノムには疾患を引き起こさない构造変化が数千个以上存在しています。これらをうまく除外することにより、疾患と関係する构造変化をより効率よく见つけることができると考えられます。今回、同じ疾患を持たない个人のゲノム(コントロール)に存在する构造多型を、诲苍补谤谤补苍驳别を用いて除外し、患者さんだけで见られる病的意义を持つ候补となる构造异常领域を100个以下に绞ることができました。
1例の患者さんでは、5本の染色体が18个の切断点を持ち、非常に复雑な构造変化をきたしていました。この患者さんのゲノムが実际にどのように変化しているのかを知ることは、従来法では极めて困难でした。そこで本研究では、これらの构造多型の位置関係を、自动で推测するツール诲苍补谤谤补苍驳别-濒颈苍办を开発することにより、この复雑なゲノム构造异常を再构成することができました。この再构成によって、染色体破砕により3箇所の広い领域が欠失していることがわかりました(図3)。これらの欠失は、ゲノム构造を完全に再构成することで初めて描出することが可能となるため、従来の切断点を検出する手法だけで欠失したゲノム领域を同定することは困难であったと考えられます。
また、构造変化の影响やメカニズムを调べるには、ゲノム上の切断点を知ることが重要です。しかし、现在のロングリード?シークエンサーから出されるデータはエラーが多いため、一塩基の精度で正确な配列を知ることは困难な场合がありました。そこで多重アライメントソフトウェア惭础贵贵罢()を用いて、コンセンサス配列*9を作成する手法濒补尘补蝉蝉别尘产濒别(ラマセンブル)を开発し、构造変化部位のコンセンサス配列を得ました(図2)。コンセンサス配列から明らかになった构造多型の切断点は、サンガーシークエンス*10により确认された切断点と0?1塩基しかずれておらず、极めて高精度であり、染色体破砕をきたしたゲノム构造异常のメカニズムを考察することが可能となりました。
1例の患者さんでは、5本の染色体が18个の切断点を持ち、非常に复雑な构造変化をきたしていました。この患者さんのゲノムが実际にどのように変化しているのかを知ることは、従来法では极めて困难でした。そこで本研究では、これらの构造多型の位置関係を、自动で推测するツール诲苍补谤谤补苍驳别-濒颈苍办を开発することにより、この复雑なゲノム构造异常を再构成することができました。この再构成によって、染色体破砕により3箇所の広い领域が欠失していることがわかりました(図3)。これらの欠失は、ゲノム构造を完全に再构成することで初めて描出することが可能となるため、従来の切断点を検出する手法だけで欠失したゲノム领域を同定することは困难であったと考えられます。
また、构造変化の影响やメカニズムを调べるには、ゲノム上の切断点を知ることが重要です。しかし、现在のロングリード?シークエンサーから出されるデータはエラーが多いため、一塩基の精度で正确な配列を知ることは困难な场合がありました。そこで多重アライメントソフトウェア惭础贵贵罢()を用いて、コンセンサス配列*9を作成する手法濒补尘补蝉蝉别尘产濒别(ラマセンブル)を开発し、构造変化部位のコンセンサス配列を得ました(図2)。コンセンサス配列から明らかになった构造多型の切断点は、サンガーシークエンス*10により确认された切断点と0?1塩基しかずれておらず、极めて高精度であり、染色体破砕をきたしたゲノム构造异常のメカニズムを考察することが可能となりました。
(図3)1例では复数の构造多型が非常に复雑に络み合っていたが、本研究で全体像を见ることができた(上図)。全体像を构筑することによって初めて明らかとなった欠失部位は黄色で示す(下図、5本の染色体に18个の切断点が存在する。切断点は灰色の横线で繋がった部分で示した。赤线は参照ゲノム配列に対して顺行であり、青线は逆転がおきていることを示す)。
今后の展开
本研究により、従来の手法で解决困难であった染色体転座の患者さんのゲノム配列を、新技术であるロングリード?シークエンサーで読んだデータを用いて、疾患と関係するゲノム构造変化を明らかにする手法を确立しました。従来の手法では解析が难しい、染色体破砕のような非常に复雑な构造変化が解き明かされるようになり、遗伝性疾患の病态解明に繋がることが期待されます。
用语説明
*1 ロングリード?シークエンサー: 1万塩基以上のDNA配列を一つづきに読むことができる装置。Oxford Nanopore TechnologiesやPacific Biosciences社の装置が使われる。
*2 染色体破砕(クロモスリプシス): 染色体が複数の断片に破砕され、再結合されることでゲノムに複雑な構造変化が起きること。遺伝子領域が欠損したり、遺伝子の発現に影響を与えたりすることで、がんや先天性疾患を引き起こすことが知られている。
*3 染色体転座: 染色体の一部が切断され、異なる染色体と再結合して入れ代わる変化。
*4 ナノポアシークエンサー: Oxford Nanopore Technologies社のロングリード?シークエンサー。ナノポアというタンパク質の穴が人工膜に埋め込まれており、ナノポアをDNA分子が通り抜ける時に起きる電流の変化によって、DNAの配列を解析することができる。
*5 顿狈础塩基配列: ゲノムを構成する顿狈础塩基配列は、グアニン(G)、シトシン(C)、アデニン(A)、チミン(T)の4種類からなる。
*6 构造多型: ゲノムの比較的大きな領域に起きる変化。欠失?重複?逆位?転座?挿入など、複数のパターンに分類される。量の変化を伴うものは、CNV(copy number variation)と呼ばれる。
*7 配列アライメント: 複数のDNAなどの配列を、似たものが同じ位置に来るように並べたもの、またその手法。
*8 解析パイプライン: データ解析は複数の手法を使って行われることが多いが、これらを一連の流れとして組み合わせたもの。
*9 コンセンサス配列: 配列アライメントの各位置において最も確からしい塩基を計算し、1種類の配列を決めること。
*10 サンガーシークエンス: 1970年代にフレデリック?サンガーが開発した塩基配列の決定法で、DNAポリメラーゼを用いて、末端が特定の塩基に対応するDNA断片を合成し、一つひとつDNA 配列を決めていく。
*2 染色体破砕(クロモスリプシス): 染色体が複数の断片に破砕され、再結合されることでゲノムに複雑な構造変化が起きること。遺伝子領域が欠損したり、遺伝子の発現に影響を与えたりすることで、がんや先天性疾患を引き起こすことが知られている。
*3 染色体転座: 染色体の一部が切断され、異なる染色体と再結合して入れ代わる変化。
*4 ナノポアシークエンサー: Oxford Nanopore Technologies社のロングリード?シークエンサー。ナノポアというタンパク質の穴が人工膜に埋め込まれており、ナノポアをDNA分子が通り抜ける時に起きる電流の変化によって、DNAの配列を解析することができる。
*5 顿狈础塩基配列: ゲノムを構成する顿狈础塩基配列は、グアニン(G)、シトシン(C)、アデニン(A)、チミン(T)の4種類からなる。
*6 构造多型: ゲノムの比較的大きな領域に起きる変化。欠失?重複?逆位?転座?挿入など、複数のパターンに分類される。量の変化を伴うものは、CNV(copy number variation)と呼ばれる。
*7 配列アライメント: 複数のDNAなどの配列を、似たものが同じ位置に来るように並べたもの、またその手法。
*8 解析パイプライン: データ解析は複数の手法を使って行われることが多いが、これらを一連の流れとして組み合わせたもの。
*9 コンセンサス配列: 配列アライメントの各位置において最も確からしい塩基を計算し、1種類の配列を決めること。
*10 サンガーシークエンス: 1970年代にフレデリック?サンガーが開発した塩基配列の決定法で、DNAポリメラーゼを用いて、末端が特定の塩基に対応するDNA断片を合成し、一つひとつDNA 配列を決めていく。
掲载论文
A pipeline for complete characterization of complex germline rearrangements from long DNA reads
Satomi Mitsuhashi, Sachiko Ohori, Kazutaka Katoh, Martin C Frith, Naomichi Matsumoto
Genome Medicine (2020) DOI:
Satomi Mitsuhashi, Sachiko Ohori, Kazutaka Katoh, Martin C Frith, Naomichi Matsumoto
Genome Medicine (2020) DOI:
※本研究は、国立研究開発法人日本医疗研究開発機構(AMED)の難治性疾患実用化研究事業「新技術を用いた難治性疾患の高精度診断法の開発」(研究代表者:松本直通)、厚生労働省、日本学術振興会、武田科学振興財団の支援により実施されました。
※本研究の共同研究により开発されたツールは以下になります。
dnarrange:
lamassemble:
※本研究の共同研究により开発されたツールは以下になります。
dnarrange:
lamassemble:
お问合わせ先
大学院医学研究科 遺伝学 教授 松本直通
E-mail : naomat@yokohama-cu.ac.jp
TEL:045-787-2606
(取材対応窓口、资料请求など)
研究?产学连携推進課長 山﨑 理絵
E-Mail : kenkyupr@yokohama-cu.ac.jp
TEL:045-787-2510


