我们需要提取下面的表格到本地,具体图片如下:
我们首先先点击表格右上角的JSON下载为JSON格式(假设保存的为data.json
格式),打开可以发现其数据与表格上的数据是有差别的,我们用如下代码进行处理:1234567891011121314151617181920212223#-*-coding:utf-8-*-# author:kangsgoimport jsonmodel={}#解码jsonwith open('data.json','r',encoding='utf-8') as json_file: model=json.load(json_file)#写入到data.csv文件中f=open('data.csv','w')count=0for i in model: a=[] for j in i['consequence']: a.append(j['transcript']['aa_change']) a=list(set(a)) f.write(i['genomic_dna_change']+';'+i['ssm_id']+';'+i['mutation_subtype']+';' \ +str(len(a))+'/567'+';'+str(len(i['consequence']))+'/10188') f.write('\n') count += 1f.close()
将会得到data.csv
的csv文件,可以用excel等工具进一步处理分析。