SPL vs Python 栏目下的全部文章

分组子集连续区间比上期

分类:SPL vs Python

任务:计算各股票最长连涨天数 Python 1 import pandas as pd 2 def con_rise(stock:pd.DataFrame): 3     rise_day_list = [] 4     rise_num = 0 5     shift_1 = stock[‘CL’]>s …

分组子集跨行计算并过滤分组结果

分类:SPL vs Python

任务:找出发生过连续三交易日涨停(涨幅10%)的股票 Python 1 import pandas as pd 2 def con_rise(stock:pd.DataFrame): 3     rise_day_list = [] 4     rise_num = 0 5     shift_1 = stoc …

分组子集排序和过滤

分类:SPL vs Python

任务:找出1995年每个月销售额都在前8名的销售员 Python 1 import pandas as pd 2 sale_file = ‘E:\\txt\\SalesRecord.txt’ 3 sale_info = pd.read_csv(sale_file,sep = ‘\t’) 4 sale_info[‘month’]=pd.to_datetime(sale_info[‘sale_d …

外键关联2

分类:SPL vs Python

任务:找出部门经理最年轻的部门 Python 1 import pandas as pd 2 import datetime 3 emp_file = “E:/txt/EMPLOYEE.txt” 4 manager_file = “E:/txt/DEPARTMENT.txt” 5 emp_info = pd.read_csv(emp_file,sep=’\t’) 6 manager_info = pd.read …

外键关联1

分类:SPL vs Python

任务:找出员工中夫妻工资和超过10000的员工 Python 1 import pandas as pd 2 emp_file = “E:\\txt\\Employees.txt” 3 rel_file = “E:\\txt\\EmpRel.txt” 4 emp_info = pd.read_csv(emp_file,sep=’\t’) 5 rel_info = pd.read_csv(rel_file,se …

针对选出记录计算比上期

分类:SPL vs Python

任务:某支股票股价最高的三个交易日的交易信息和涨幅 Python 1 import pandas as pd 2 stock1001_file = “E:\\txt\\stock1001_price.txt” 3 stock1001 = pd.read_csv(stock1001_file,sep = ‘\t’) 4 CL = stock1001[‘CL’] 5 CL_psort = CL.ar …

针对累计值过滤

分类:SPL vs Python

任务:找出销售额占到一半的前n个客户,并按销售额从大到小排序 Python 1 import pandas as pd 2 sale_file = “E:\\txt\\sales_volume.csv” 3 sale_info = pd.read_csv(sale_file) 4 sale_info.sort_values(by=’Amount’,inplace=True,ascending …

分栏

分类:SPL vs Python

任务:分栏列出各部门工资超过8000的员工信息(工资从高到低排序) Python 1 import pandas as pd 2 sale_file = “E:\\txt\\sales_volume.csv” 3 sale_info = pd.read_csv(sale_file) 4 sale_info.sort_values(by=’Amount’,inplace=True,ascend …

常规运算

分类:SPL vs Python

任务:从文本中找出男25岁以上、女23岁以上的人:1) 按姓名排序列出;2) 按性别分组计算平均年龄; 3) 列出所有出现过的姓氏(不考虑复姓)

WordCount

分类:SPL vs Python

任务:统计某文档的单词数量 Python 1 data=pd.read_csv(file,sep=”\n”,header=None) 2 tmp=[] 3 data=data.iloc[:,0].apply(lambda x:tmp.extend(x.split())) 4 pd.Series(1,tmp).groupby(level=0).count() 这里只是对文档按空字符分割,如 …