轉座酶介導的片段化(Nextera 系列):Nextera XT 試劑盒采用 Tn5 轉座酶,通過 “切割 - 連接" 同步反應,將接頭序列直接插入 DNA 片段兩端,片段化過程無需超聲破碎,片段大小可通過轉座酶濃度(0.1-0.5 U/μL)與反應時間(5-15 分鐘)精準調控,片段大小偏差<±20 bp。實驗數據顯示,針對 1 μg 人類基因組 DNA,轉座酶片段化可獲得 200-300 bp 的均一片段,片段均一性較超聲破碎法提升 40%,且 GC 富集區(如啟動子區域)片段化效率與普通區域無顯著差異(偏差<5%)。
超聲破碎優化(TruSeq 系列):TruSeq Nano 試劑盒配套專用超聲破碎儀(Covaris S220),采用聚焦超聲技術,將超聲能量集中于樣本區域,避免傳統超聲儀的能量分散問題,片段大小可在 150-1000 bp 范圍內精準設置,片段大小 CV 值<10%,傳統超聲儀 CV 值達 25%-30%。同時,破碎緩沖液中添加 GC 穩定劑(如甜菜堿,1 mol/L),保護 GC 富集區 DNA 不被過度切割,確保全基因組范圍內片段化均勻。
片段篩選工藝:采用磁珠法(AMPure XP 磁珠)進行片段篩選,通過調整磁珠與樣本的體積比(0.6×-1.2×),精準篩選目標片段。例如,篩選 200-300 bp 片段時,磁珠體積比設置為 0.8×,可去除<150 bp 的短片段與>350 bp 的長片段,片段回收率達 85% 以上,傳統瓊脂糖凝膠電泳回收回收率僅 60%-70%。
Y 型接頭結構:接頭采用 Y 型雙鏈結構,5' 端為互補區域(用于連接 DNA 片段),3' 端為非互補區域(含索引序列 Index)。連接過程中,Y 型接頭僅與 DNA 片段兩端的粘性末端結合,避免傳統平末端接頭的自連接問題(自連接率<5%,傳統接頭自連接率達 30%-40%),連接效率提升至 80% 以上。
索引序列優化:接頭含雙索引序列(i5 與 i7),每個索引序列含 8 個堿基,可組合生成 96×96=9216 種不同的索引組合,支持高通量樣本 multiplexing(混樣測序)。索引序列經過嚴格篩選,避免與基因組 DNA 同源(同源性<20%),減少索引跳躍(Index Hopping)現象(發生率<0.1%),傳統單索引序列索引跳躍率達 1%-2%。
測序引物結合區設計:接頭 3' 端含 Illumina 測序平臺專用引物結合區(如 P5、P7 序列),與測序儀的流動槽探針(Flow Cell Probe)互補,確保文庫在流動槽上的高效雜交(雜交效率>95%),雜交時間從傳統的 30 分鐘縮短至 10 分鐘,且雜交特異性高(非特異性雜交率<1%)。
高保真 DNA 聚合酶:采用 Phusion 高保真 DNA 聚合酶(錯誤率<1×10??),其 3'-5' 外切酶活性可校正錯配堿基,同時具備高延伸效率(延伸速度 1 kb/min),擴增效率較 Taq 酶提升 30%。針對高 GC 區域(GC 含量>65%),聚合酶可有效突破二級結構,擴增效率偏差<10%,傳統 Taq 酶在高 GC 區域擴增效率下降 50% 以上。
擴增緩沖液優化:緩沖液中添加甜菜堿(1 mol/L)與二甲基亞砜(DMSO,5%),甜菜堿可降低 DNA 二級結構的穩定性,DMSO 可提高聚合酶在高 GC 區域的延伸能力,兩者協同作用使全基因組范圍內擴增效率均一(擴增效率 CV 值<5%)。同時,緩沖液中含 dUTP(代替 dTTP),可通過 UDG 酶(尿嘧啶 - DNA 糖基化酶)在測序前去除攜帶 dUTP 的擴增子,避免交叉污染(污染率<0.01%)。
循環數精準控制:根據初始 DNA 量(10 ng-1 μg)推薦最佳循環數(8-12 個循環),避免過度擴增導致的文庫異質性(如過度擴增會導致短片段富集)。實驗驗證顯示,100 ng 人類基因組 DNA 經 10 個循環擴增后,文庫濃度達 50 ng/μL,片段大小分布均一(200-300 bp 占比>90%),測序后覆蓋度 CV 值<8%,傳統 20 個循環擴增覆蓋度 CV 值達 25%。
樣本處理:取 1 μg 人類外周血基因組 DNA,使用 Covaris S220 超聲破碎儀將 DNA 片段化為 200-300 bp,加入末端修復酶(T4 DNA 聚合酶、Klenow 片段)修復粘性末端,5' 端磷酸化,3' 端加 A 尾(Klenow 片段 3'-5' 外切酶活性缺失突變體)。
接頭連接與擴增:加入 Y 型接頭(含 i5/i7 索引),T4 DNA 連接酶 16℃連接 16 小時;使用 AMPure XP 磁珠(0.8× 體積比)篩選連接產物,去除未連接接頭的片段;加入 Phusion 高保真聚合酶,進行 10 個循環的 PCR 擴增(98℃ 10 秒→60℃ 30 秒→72℃ 30 秒)。
測序與結果分析:文庫經 Agilent 2100 生物分析儀檢測,片段大小 250±20 bp,濃度 50 ng/μL;在 Illumina NovaSeq 6000 平臺進行雙端 150 bp 測序,測序深度 30×,Q30 值>95%,基因組覆蓋度>99.5%,Contig N50 達 50 kb,與傳統文庫制備方法相比,de novo 組裝效率提升 30%,錯誤率降低 50%。
文庫制備:取 100 ng 腫瘤組織基因組 DNA,使用 Tn5 轉座酶片段化并連接接頭(5 分鐘反應),8 個循環 PCR 擴增;加入外顯子捕獲探針(覆蓋人類 20,000 個外顯子,約 30 Mb),65℃雜交 24 小時,使用磁珠捕獲雜交復合物,12 個循環 PCR 擴增富集捕獲產物。
測序與突變分析:在 Illumina HiSeq X Ten 平臺進行雙端 150 bp 測序,測序深度 100×,外顯子區域覆蓋度>98%(≥20× 覆蓋度);使用 GATK 軟件分析基因突變,檢測到腫瘤組織中存在 EGFR L858R 突變(等位基因頻率 15%)、TP53 R273H 突變(等位基因頻率 8%),與 Sanger 測序結果一致,低頻突變檢出率達 0.1%,傳統文庫制備方法低頻突變檢出率僅 1%。
ctDNA 提取與文庫制備:取 10 mL 癌癥患者血漿,使用 Qiagen QIAamp Circulating Nucleic Acid Kit 提取 ctDNA(約 10 ng);加入 Tn5 轉座酶(低濃度 0.1 U/μL)片段化 ctDNA,連接含 UMI(分子標識符)的接頭(每個 DNA 分子攜帶12 bp UMI),12 個循環 PCR 擴增(含 dUTP)。
測序與 UMI 去重:在 Illumina NextSeq 550 平臺進行雙端 150 bp 測序,測序深度 10,000×;通過 UMI 去重去除 PCR 重復(重復率<10%),使用 Mutect2 軟件分析基因突變,檢測到患者 ctDNA 中存在 KRAS G12D 突變(等位基因頻率 0.05%),與腫瘤組織測序結果一致,傳統文庫制備方法因無 UMI 去重,無法檢測到<0.1% 的低頻突變。