我们需要提取下面的表格到本地,具体图片如下:

图片1
图片1

我们首先先点击表格右上角的JSON下载为JSON格式(假设保存的为data.json格式),打开可以发现其数据与表格上的数据是有差别的,我们用如下代码进行处理:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
#-*-coding:utf-8-*-
# author:kangsgo
import json
model={}
#解码json
with open('data.json','r',encoding='utf-8') as json_file:
model=json.load(json_file)
#写入到data.csv文件中
f=open('data.csv','w')
count=0
for i in model:
a=[]
for j in i['consequence']:
a.append(j['transcript']['aa_change'])
a=list(set(a))
f.write(i['genomic_dna_change']+';'+i['ssm_id']+';'+i['mutation_subtype']+';' \
+str(len(a))+'/567'+';'+str(len(i['consequence']))+'/10188')
f.write('\n')
count += 1
f.close()

将会得到data.csv的csv文件,可以用excel等工具进一步处理分析。