【質問内容】こちらのサイトの下(endoglucanase [Cellvibrio japonicus] - Protein - NCBI
QEI18240.1 endoglucanase [Cellvibrio japonicus]
MNLLSGWVRPLMLGCGLLGAALSAGSIQAAVCEYRVTNEWGSGFTASIRITNNGSSTINGWSVSWNYTDG
SRVTSSWNAGLSGANPYSATPVGWNTSIPIGSSVEFGVQGNNGSSRAQVPAVTGAICGGQGSSAPSSVAS
SSSSSSVVSSTPRSSSSSVSSSVPGTSSSSSSSVLTGAQACNWYGTLTPLCNNTSNGWGYEDGRSCVART
TCSAQPAPYGIVSTSSSTPLSSSSSSRSSVASSSSLSSATSSSASSVSSVPPIDGGCNGYATRYWDCCKP
HCGWSANVPSLVSPLQSCSANNTRLSDVSVGSSCDGGGGYMCWDKIPFAVSPTLAYGYAATSSGDVCGRC
YQLQFTGSSYNAPGDPGSAALAGKTMIVQATNIGYDVSGGQFDILVPGGGVGAFNACSAQWGVSNAELGA
QYGGFLAACKQQLGYNASLSQYKSCVLNRCDSVFGSRGLTQLQQGCTWFAEWFEAADNPSLKYKEVPCPA
ELTTRSGMNRSILNDIRNTCP
とあるアミノ酸配列の情報を自動でスクレイピング取得したいです。
同じような作業を全432ページ行わないといけないため、自動でやりたいと考えているのですが、
ページ読み込み後にすぐ反映されない仕様のためかうまくスクレイピングできません。
XPathを指定することで解決するのでしょうか。自分の知識不足のためそこらへんがあまり分かっておらず、どなたかお力添えいただけると嬉しいです。
該当部分をスクレイピングしようとして表示されるもの↓
FASTAFormatSummaryGenPeptGenPept (full)FASTAFASTA (text)GraphicsASN.1Revision HistoryAccession ListGI ListApplySend to:
jQuery(document).ready( function () {
jQuery(“#send_to_menu input[type=‘radio’]”).click( function () {
var selectedValue = jQuery(this).val().toLowerCase();
var selectedDiv = jQuery(“#send_to_menu div.” + selectedValue);
if(selectedDiv.is(“:hidden”)){
jQuery(“#send_to_menu div.submenu:visible”).slideUp();
selectedDiv.slideDown();
}
});
});
jQuery(“#sendto”).bind(“ncbipopperclose”, function(){
jQuery(“#send_to_menu div.submenu:visible”).css(“display”,“none”);
jQuery(“#send_to_menu input[type=‘radio’]:checked”).attr(“checked”,false);
});
Choose DestinationFileClipboardCollectionsAnalysis ToolFormatSummaryGenPeptGenPept (full)FASTAASN.1XMLINSDSeq XMLTinySeq XMLFeature TableFASTA CDSAccession ListGI ListGFF3
function x_showgi(el) {
// ID-4455
var elSeq = document.getElementById(“file_showgi_section”);
if (el.options[el.selectedIndex].getAttribute(“showgi”) === “true”) {
elSeq.style.display = “”;
} else {
elSeq.style.display = “none”;
}
}
setTimeout(function() {
x_showgi(document.getElementById(“file_format”));
}, 1000);
Show GICreate FileAdd to ClipboardAdd to Collections
function x_analysistool_evt(el) {
var elBtn = document.getElementById(“analysistool_submit_btn”);
console.info(" x_analysistool_evt, el=", el);
elBtn.setAttribute(“submit_url”, el.getAttribute(“submit_url”));
}
Choose Sequence Analysis ToolBLASTConserved Domains SearchSubmit