抗體藥物的特異性和有效性高度依賴于抗體的氨基酸序列 和抗體上存在的特異性翻譯后修飾。在單克隆抗體的研發(fā) 階段,主要是通過 dna 測(cè)序來進(jìn)行初次驗(yàn)證,但是對(duì)于一 些預(yù)臨床的抗體藥物,可能來自于免疫的宿主、商業(yè)化的 抗體產(chǎn)品、合作實(shí)驗(yàn)室的抗體樣品或者來自于雜交瘤細(xì)胞 的產(chǎn)物,很多都無法得到其 cdna 序列;在這種情況下, 我們需要直接在蛋白水平進(jìn)行單抗分子的完整氨基酸序列 及其翻譯后修飾分析,從而解決預(yù)臨床實(shí)驗(yàn)中存在的一些 問題,同時(shí)對(duì)單抗產(chǎn)品的質(zhì)量進(jìn)行控制分析。
在沒有蛋白氨基酸序列的前提下進(jìn)行蛋白的氨基酸 序列和翻譯后修飾分析稱為蛋白從頭測(cè)序(de novo sequencing)。實(shí)現(xiàn)蛋白從頭測(cè)序主要有兩種方法: edman 降解法和質(zhì)譜分析法。edman 降解法一般適合 15-20 個(gè)氨基酸組成的肽段,不能超過 30 個(gè)氨基酸,且對(duì) 于樣品純度要求也比較高,至少 97% 純度以上;同時(shí)還 要進(jìn)行蛋白酶解、肽段分離純化和肽段逐一上機(jī)測(cè)試,另 外,對(duì)于一個(gè)單抗進(jìn)行 edman 降解測(cè)序的時(shí)間成本和經(jīng) 濟(jì)成本也比較高。而與傳統(tǒng)的 edman 降解法相比,基于 質(zhì)譜的方法更加高通量、率和低成本,即使在已知蛋 白氨基酸序列的情況下,從頭測(cè)序的方法也可以發(fā)現(xiàn)一些 新的蛋白變體,這些蛋白變體可能來自未知的突變、剪切 拼接和各種翻譯后修飾,從而為單抗序列提供更加全面的 信息,因此基于質(zhì)譜的蛋白 de novo 測(cè)序法已經(jīng)逐漸進(jìn)入 生物制藥產(chǎn)品的研發(fā)階段。
質(zhì)譜從頭測(cè)序的方法簡(jiǎn)單、快速并且直接,但是也存在很 多挑戰(zhàn):為了得到盡可能豐富的碎片信息,我們需要采用
多種酶酶切和多種質(zhì)譜碎裂方式組合的高分辨、高質(zhì)量精 度質(zhì)譜進(jìn)行數(shù)據(jù)采集,然后通過蛋白 de novo 測(cè)序軟件的 分析和拼接,得到終的單抗氨基酸序列信息,分析流程 如圖 1 所示。在此,我們使用了 trypsin,chymotrypsin, lysc,gluc 和 aspn 5 種酶進(jìn)行多酶酶切,同時(shí)使用我們新的三合一超高分辨質(zhì)譜 fusion lumos 進(jìn)行高質(zhì)量的 高能碰撞解離(hcd)和電子轉(zhuǎn)移解離(etd)數(shù)據(jù)采集。 目前,在質(zhì)譜數(shù)據(jù)采集過程中,常用的碎裂方式為:碰撞 誘導(dǎo)激活解離(cid)和高能碰撞解離(hcd)兩種解離方式, 由于 hcd 碎裂產(chǎn)生的二級(jí)原始譜圖的質(zhì)量更好,與理論 的匹配度更高,因此我們更多的采用 hcd 來進(jìn)行二級(jí)碎 裂,產(chǎn)生相應(yīng)的 b,y 碎片離子。而電子轉(zhuǎn)移解離(etd) 作為一種補(bǔ)充碎裂方式,可以產(chǎn)生與 b,y 離子互補(bǔ)的 c, z 離子,從而更加準(zhǔn)確的確定氨基酸序列;另外 etd 可以 保留側(cè)鏈易于丟失的一些翻譯后修飾基團(tuán),比如磷酸化基 團(tuán),因此可以準(zhǔn)確的確定蛋白質(zhì)翻譯后修飾的位點(diǎn);同時(shí)由于電子轉(zhuǎn)移的特征,etd 偏向于碎裂帶電荷數(shù)目比較高、 質(zhì)核比相對(duì)比較低的肽段,從而可以實(shí)現(xiàn)一些大肽段的有 效鑒定。綜合考慮,etd 與 hcd 相互結(jié)合,可以準(zhǔn)確確 定完整的氨基酸序列以及翻譯后修飾位點(diǎn)的信息。
2 實(shí)驗(yàn)部分 2.1 儀器和試劑
質(zhì)譜儀器:賽默飛fusion lumos(賽默飛世爾科技,美國(guó));
色譜儀器:easy nano1000 液相色譜系統(tǒng)(賽默飛世爾科技, 美國(guó)); 色譜柱:home made nano column(c18,2 µm, 75×150 µm,100 å);
試劑:色譜級(jí)甲酸、二次去離子水、色譜級(jí)乙腈;
2.2 儀器方法
色譜分析條件:具體見表 1;
質(zhì)譜分析條件:具體見表 2;
2.3 數(shù)據(jù)分析方法
使用 p novo 軟件對(duì)原始譜圖進(jìn)行 de novo 分析,得到終 的肽段列表,然后再結(jié)合單克隆抗體的氨基酸結(jié)構(gòu)特征進(jìn)行 蛋白水平上的數(shù)據(jù)整合。
3. 結(jié)果與討論 在 這 里, 我 們 使 用 了 trypsin,chymotrypsin,lysc, gluc 和 aspn 5 種酶進(jìn)行多酶酶切,同時(shí)使用我們新的 三合一超高分辨質(zhì)譜 fusion lumos 進(jìn)行高質(zhì)量的高能碰 撞解離(hcd)和電子轉(zhuǎn)移解離(etd)數(shù)據(jù)采集,并且 通過 p novo 軟件數(shù)據(jù)分析和數(shù)據(jù)整合,得到終的氨基 酸序列信息。
為了得到豐富的肽段和碎片離子的信息,我們使用了 5 種 不同的酶進(jìn)行酶解,相應(yīng)的一級(jí)色譜質(zhì)譜流出圖如圖 2 所 示,可以看到使用不同的酶所產(chǎn)生的肽段數(shù)目和豐度不 同:lysc 和 trypsin 主要產(chǎn)生堿性氨基酸結(jié)尾的肽段, chymotrypsin 主要產(chǎn)生疏水性氨基酸結(jié)尾的肽段,gluc 主要產(chǎn)生酸性氨基酸結(jié)尾的肽段,aspn 主要產(chǎn)生天冬氨 酸開頭的肽段,因此肽段的帶電荷數(shù)目和長(zhǎng)度不同,也 就造成有些肽段適合進(jìn)行 hcd 分析,有些肽段適合進(jìn)行 etd 分析,所以我們?cè)诤罄m(xù)的質(zhì)譜分析中,分別對(duì)同一母 離子進(jìn)行了這兩種碎裂方式的解離,從而得到完整的 b, y,c,z 離子的信息,更加有利于后續(xù)的氨基酸序列的確 定和整合。以其中的一個(gè)母離子( m/z =796.3997,z=3) 為例,如圖 3 所示,可以看到在不同的碎裂方式下,產(chǎn)生 的碎片離子的質(zhì)核比和強(qiáng)度也是不同的,因此可以得到更 加全面的肽段氨基酸序列的信息。
基于高質(zhì)量精度、高分辨率和高靈敏度兼具的原始質(zhì)譜數(shù) 據(jù),我們通過 p novo 軟件搜庫和人工整合后,得到了抗 體的完整序列信息。本文中以 herceptin 抗體的 de novo 測(cè)序?yàn)槔?,終通過 5 種不同酶切和 2 種不同的碎裂方式, 得到了如圖 4 所示的氨基酸序列信息,并且與理論氨基酸 序列*一致,因此我們可以證明該分析流程可以直接應(yīng) 用到常規(guī)抗體的 de novo 分析中。
針對(duì)單抗重要的 cdr 區(qū)域,我們對(duì)來源于該區(qū)域肽段 的 hcd 和 etd 原始譜圖分別進(jìn)行了確認(rèn)。以輕鏈區(qū)域的 rasqdvntavawyqqkpgk 為例,該肽段對(duì)應(yīng)的 hcd 和 etd 碎片離子匹配譜圖如圖 5 所示,hcd 碎裂譜圖中碎片 離子的覆蓋度為 78%,etd 碎裂譜圖中碎片離子的覆蓋度 為 86%,兩者結(jié)合可以實(shí)現(xiàn)碎片離子的 100% 覆蓋,由此 我們可以確定該 cdr 區(qū)域的氨基酸序列信息。同理,其它 的 cdr 區(qū)域也都分別進(jìn)行了 hcd 和 etd 譜圖的確認(rèn),另 外對(duì)于 fab 和 fc 區(qū)域,也都進(jìn)行了譜圖確認(rèn)。由此可見 該分析流程可以準(zhǔn)確、快速的應(yīng)用到其它的蛋白藥物的 de vovo 分析中。
4. 結(jié)論 本文基于新的三合一超高分辨質(zhì)譜平臺(tái) fusion lumos, 通 過 trypsin,lysc,chymotrypsin,gluc 和 aspn 5 種酶進(jìn) 行多酶酶切,采用 hcd 和 etd 兩種互補(bǔ)碎裂方式,以及后 續(xù)的軟件分析和人工確認(rèn),建立了單抗藥物簡(jiǎn)單、快速的 de novo 質(zhì)譜測(cè)序分析流程,為未知氨基酸序列蛋白藥物的 分析和確認(rèn)提供了質(zhì)譜方法,有望大規(guī)模應(yīng)用于生物制藥企 業(yè)的早期研發(fā)中。