catch-img

DNA配列の改善でタンパク質の合成量が上がる!最適化のための6つのチェックポイント

同じ発現方法を用いても、タンパク質の種類によって、合成量が異なることはよくあります。タンパク質の合成量が低い場合、鋳型DNAの塩基配列やアミノ酸配列に原因があることがあります。

しかし、配列のどこを、どう見直せばよいか、わからないことも多いかも知れません。

この記事では、PUREfrexのキットで合成するタンパク質の鋳型DNA配列を見直す際の、6つのチェックポイントについて解説します。


目次[非表示]

  1. 1.チェックポイント① 開始コドン直後の配列をATリッチにする
  2. 2.チェックポイント② 偏ったコドンの使用を避ける
  3. 3.チェックポイント③ 5’UTR~N末端近傍の二次構造形成を避ける
  4. 4.チェックポイント④ N末端付近のプロリンやグリシンを避ける
  5. 5.チェックポイント⑤ フレームシフトしにくいコドンを選ぶ
  6. 6.チェックポイント⑥ 連続したプロリン配列がないか確認する
  7. 7.まとめ

チェックポイント① 開始コドン直後の配列をATリッチにする

開始コドン(ATG)直後の2番目から6番目のアミノ酸のコドンでは、できるだけATが多くなるようなコドンを選択します。この領域に限っては、大腸菌のコドンの使用頻度よりも、ATリッチを優先することがポイントです。

下の図は、そのままの配列では合成量が低い Trastuzumab (Herceptin) 重鎖(HC)の開始コドン以下2番目から6番目のコドンを複数組み合わせ54種類の鋳型DNAを作成し、すべての鋳型DNAからタンパク質を合成し、それぞれの合成量を比較した結果です。

その結果、組み合わせるコドンの種類により、合成量が大きく異なりました。できるだけATが多くなるコドンを選択した場合に、合成量が高くなり、この傾向は、他のタンパク質でもみられます。


<図の説明>N末端領域のコドンがタンパク質合成量に与える影響

A. Trastuzumab (Herceptin) 重鎖(HC)のN末端領域のコドン
B. 異なるコドンを使用した鋳型DNAから合成した場合の合成量の比較


チェックポイント② 偏ったコドンの使用を避ける

様々なメーカーから提供されているコドンを最適化するツールを用いて、合成したいタンパク質の塩基配列を大腸菌用に最適化した場合、大腸菌で使用頻度の高い1つのコドンのみが使用される場合があります。例えば、ロイシンでCTGコドンのみが使用されている場合です。

コドンが極度に偏ったDNAを用いてPUREfrexキットでタンパク質の合成を行うと、合成量が低くなることがあります。 このような場合は、大腸菌のコドンの使用頻度に合わせて適度に割り振ります。

E. coli K12株のコドン使用頻度はこちらも参照ください。
https://www.kazusa.or.jp/codon/cgi-bin/showcodon.cgi?species=83333&aa=1&style=N


チェックポイント③ 5’UTR~N末端近傍の二次構造形成を避ける

SD配列(リボソーム結合部位)がマスクされるとリボソームが結合しにくくなり、合成量が低下することがあります。これは、SD配列付近~N末端近傍(開始から10アミノ酸程度)をコードする領域で、mRNAが強固な二次構造を形成する場合におこると考えられます。

この領域で強い二次構造形成が予測される場合には、コドンを置換して塩基配列を調整する必要があります。

​​​​​​​二次構造予測の例として、PUREfrexキットの陽性コントロールとして添付されているDHFR DNAについて、RNAfold server(http://rna.tbi.univie.ac.at/cgi-bin/RNAWebSuite/RNAfold.cgi)で解析した結果を示します。図Bの解析結果で、SD配列部分(AAGGAG)が二次構造を取らないため、合成量は低下しません。


(図の説明)翻訳開始領域の塩基配列の二次構造予測

A. DHFR DNAの5’末端領域の塩基配列。解析した領域を黄色のハイライトで示しています。
B. RNAfoldでの二次構造予測結果


チェックポイント④ N末端付近のプロリンやグリシンを避ける

開始メチオニン直後の2番目や3番目のアミノ酸が、プロリンやグリシンの場合、タンパク質の合成量が低下する場合があります。可能であれば、この部分を除去するなど、できるだけ避けた方が、合成量が上がる結果が得られています。


チェックポイント⑤ フレームシフトしにくいコドンを選ぶ

X/XXY/YYZのようなフレームシフトを起こしやすい配列が存在することがわかってきています。 例えば、リジンが2個連続し、塩基配列が「A/AAA/AAA」のような場合、「A/AAG/AAA」に置換するとフレームシフトは抑制されます。

<参考文献> Sharma V. et al. (2014) Nucleic Acids Res., vol.42, p.7210


チェックポイント⑥ 連続したプロリン配列がないか確認する

連続したプロリンを含むタンパク質を合成すると、合成量が低いことがあります。大腸菌の中では、このようなタンパク質の翻訳において、EF-Pと呼ばれる翻訳因子が関与していることが知られています。

PUREfrexキットで、プロリンが連続するタンパク質を合成する場合、EF-Pを添加することで合成量が上がるタンパク質があります。

下記よりダウンロードできるポスターに、いろいろなタンパク質の合成結果を記載しています。 https://www.genefrontier.com/files/p21_MBSJ2018.pdf


まとめ

今回ご紹介した6つのチェックポイントの内、①の開始コドン直後の配列がATリッチになっているかどうかを、はじめに確認してみてください。このポイントを改善するだけで、タンパク質の合成量が上がることが多くみられます。

PCR産物を鋳型DNAとして用いると、プライマーで簡単に調整できます。ぜひ、試してみてください。


お問い合わせ

タンパク質の合成等についてお困りではありませんか?お気軽にご相談ください。
長年、無細胞タンパク質合成について研究・開発したスタッフがお答えいたします。