Minulla on paljon ATE-tunnuksia, ja minun on hankittava näiden PDB-tunnusten erityisketjujen uniprot-fasta-sekvenssit API-palveluilta. Kuvittele esimerkiksi, että minun täytyy saada '1kf6' 'A-ketjun fasta-sekvenssi. Tämän 1kf6-ketjun uniprot-merkintä (liittyminen) on 'P00363'. Jos löydän tavan saada tämä merkintä, voin yksinkertaisesti hakea sen fasta-sekvenssin bioservices-paketin avulla:
biopalvelujen tuonnista * u = UniProt () sequence = u.retrieve ("P00363", "fasta") print (sekvenssi)
Suurin ongelma on, että en tiedä miten löydän tämän uniprot-merkinnän ("P00363 täällä") jokaiselle ketjulle PDB-tunnuksissa (tässä Luulen, etten tiedä, että tämä "P00363" on "1kf6" "A" -ketjun uniprot-merkintä ja yritän löytää sen API-palveluiden avulla). Yritin käyttää henkilötunnistusta. ID-kartoituksen ristiviittauksissa määritetään jokaisen merkinnän ketjun nimi ja jos voin lisätä ristiviittaussarakkeen u.searchiin ('1kf6', sarakkeet = "id, merkinnän nimi, pituus, geenit, pdb"), Voin yksinkertaisesti löytää suosikkiketjuuni liittyvän merkinnän. Seuraava koodi palauttaa joitain merkintöjä, jotka liittyvät yhteen 1kf6-ketjuihin. Ongelmana on, että en tiedä tarkalleen, mikä merkintä liittyy A-ketjuun, että tässä on suosikkiketjuni. Seuraavassa koodissa id etsii merkintää ja muut parametrit etsivät muuta niihin liittyvää:
biopalvelujen tuonnista * u = UniProt () res = u.search ("1kf6", sarakkeet = "id, merkinnän nimi, pituus, geenit") print (res)
Kutakin seuraavista sanoista voidaan käyttää ja lisätä sarakkeisiin:
'id', 'merkinnän nimi', 'geenit', 'geenit (KÄYTETTÄVÄT)', 'geenit (VAIHTOEHTOINEN)', 'geenit (OLN)', 'geenit (ORF)', 'organismi' , 'organismin tunnus', 'proteiinien nimet', 'proteomi', 'sukulinja (ALL)', 'sukutunnus', 'viruksen isännät', 'fragmentti', 'sekvenssi', 'pituus', 'massa', 'encodedon', 'comment (VAIHTOEHTOISET TUOTTEET)', 'comment (ERRONEOUS GENE MODEL PREDICTION)', 'comment (ERRONEOUS INICIATION)', 'comment (ERRONEOUS TERMINATION)', 'comment (ERRONEOUS TRANSLATION)', 'comment (FRAMESHIFT) ) ',' kommentti (MASSASPEKTROMETRIA) ',' kommentti (POLYMORFISMI) ',' kommentti (RNA-EDITOINTI) ',' kommentti (SEQUENCE-VAROITUS) ',' ominaisuus (ALTERNATIIVINEN SEQUENCE) ',' ominaisuus (NATURAL VARIANT) ', 'ominaisuus (NON ADJACENT RESIDUES)', 'feature (NON STANDARD RESIDUE)', 'feature (NON TERMINAL RESIDUE)', 'feature (SEQUENCE CONFLICT)', 'feature (SEQUENCE UNCERTAINTY)', 'versio (jakso)', 'verkkotunnukset', 'verkkotunnus', 'kommentti (DOMAIN)', 'kommentti (SAMANKALTAISUUS)', 'ominaisuus (KIERRETTY KELA)', 'ominaisuus (KOMPOSITIONAALINEN BIAS)', 'ominaisuus (DOMAININ MÄÄRÄ)', 'ominaisuus (MOTIF ) ',' ominaisuus (REGION) ' , 'ominaisuus (REPEAT)', 'ominaisuus (ZINC FINGER)', 'ec', 'kommentti (ABSORPTIO)', 'kommentti (CATALYTIC ACTIVITY)', 'comment (COFACTOR)', 'comment (ENZYME REGULATION)', 'kommentti (FUNCTION)', 'kommentti (KINETICS)', 'kommentti (PATHWAY)', 'kommentti (REDOX POTENTIAL)', 'kommentti (LÄMPÖTILAN RIPPU)', 'kommentti (PH-RIPPU)', 'ominaisuus (AKTIIVINEN SIVU) ) ',' ominaisuus (BINDING SITE) ',' feature (DNA BINDING) ',' feature (METAL BINDING) ',' feature (NP BIND) ',' feature (SITE) ',' go ',' go (biologinen prosessi) ',' go (molekyylifunktio) ',' go (solukomponentti) ',' go-id ',' interpro ',' vuorovaikuttaja ',' kommentti (SUBUNIT) ',' citation ',' citationmapping ',' luotu ',' viimeinen muokkaus ',' muokattu sekvenssi ',' versio (merkintä) ',' 3d ',' ominaisuus (BETA STRAND) ',' ominaisuus (HELIX) ',' ominaisuus (TURN) ',' kommentti (ALIKELLOSIJAINTI) ',' ominaisuus (INTRAMEMBRANE) ',' ominaisuus (TOPOLOGINEN DOMAIN) ',' ominaisuus (LÄHETETTÄVÄ) ',' merkintätaso ',' pisteet ',' ominaisuudet ',' kommentti (VAROITUS) ',' kommentti (KUDOSTEN ERITTELY) ',' kommentti (YLEISTÄ) ',' avainsanat ',' konteksti ',' exi stence ',' työkalut ',' tarkistettu ',' ominaisuus ',' perheet ',' osa-alueet ',' taksonomia ',' versio ',' klusterit ',' kommentit ',' tietokanta ',' avainsana-id ', 'reitti', 'pisteet'
Käytin joitain yllä olevista sanoista sarakeosassa, mutta he eivät pystyneet hakemaan ketjun nimeä. Kukaan tietää, mikä yllä olevista parametreista voi antaa minulle ketjun nimen tälle ATE: lle? vai kenelläkään on muuta ideaa löytää uniprot-merkintä (UniprotKB AC), joka liittyy jokaiseen ATE: n ID-ketjuun API-palveluiden kautta?