Exce表格网

pandas读取excel中时间数据类型(pandas 读取sheet)

来源:www.0djx.com  时间:2023-02-18 11:00   点击:218  编辑:表格网  手机版

1. pandas 读取sheet

一.导入SQL数据 # -*- coding: utf-8 -*- import pymysql.cursors # 连接数据库,这边的host到db,都是需要自己改的。 connect = pymysql.Connect( host='localhost', port=3306, user='root', passwd='123456', db='hw', charset='utf8' ) # 获取游标 cursor = connect.cursor() print (cursor) with connect.cursor() as cursor: # 执行sql语句,进行查询,这边的select语句,可以根据自己的实际需求改动 sql = 'SELECT * FROM tuandui' cursor.execute(sql) # 获取查询结果 #fetchone() 返回单个的元组,也就是一条记录(row),如果没有结果 则返回 None #注:在MySQL中是NULL,而在Python中则是None#fetchall() 返回多个元组,即返回多个记录(rows),如果没有结果 则返回 () result = cursor.fetchall() print(result) # 关闭连接 cursor.close() connect.close() 二.导入EXCEL数据 # -*- coding: utf-8 -*- """ Created on 2017/6/26 读取EXCEL中的数据 @author: gaodan """ import numpy as np from pandas import Series,DataFrame import pandas as pd import xlrd import openpyxl xls_file = pd.ExcelFile('gao.xls') table = xls_file.parse('Sheet1') print(table) 以上,因为平时工作中只接触到这两种导入,如果之后有新的应用,会来增加。

2. pandas 提取时间

# 先把数据转化成DataFrame形式 import pandas as pd data = pd.DataFrame(data,columns=["loc","value"]) # 再把对应行的数据取出来 data["value"][data["loc"]=="地区3"]

3. pandas读取excel文件使用什么代码

python利用pandas中的read_csv()读取单个excel文件,因此我们只需要批量生成文件的名称即可,然后循环读取文件名。

4. pandas读取excel日期变成了数字

首先查看电脑中是否安装pandas库,win+R→运行栏输入WindowsPowerShell→cd python安装路径(比如"F:/python"该路径下要有python.exe)→输入python -m pip show pandas回车(或者python -m pip list回车)→查看屏幕提示有无pandas的版本等信息。①如果没有,联网后,在WindowsPowerShell中输入:

cd (比如"F:/python/lib/site-packages"此为安装python第三方库的文件夹路径,具体以用户安装的实际路径为准)回车

输入python -m pip install pandas看屏幕提示,等待将其下载安装完毕。

②如果有,进入python解释器(python.exe)

用import pandas即可调用该库了。比如:

pandas.read_excel("excel文件含后辍.xls所在的路径");举例:pandas.read_excel("E:/excel/demo.xls")

pandas.read_csv("csv文件含后辍.csv所在的路径"),等等,具体pandas怎么用不再赘述。

5. pandas获取当前时间

     (1)加载数据:读取文本或者其他格式数据,本例中用到一个包含4列的文本文件,其中第一列表示年,第二列表示月,第三列和第四列表示数据,摘取部分:

2014,2,68.93,85.54

2014,3,65.96,53.19

2014,4,69.56,67.47

data = np.loadtxt(input_filename, delimiter=',')

    (2)由于数据是有序的,第一行是起始日期,而数据的最后一行是终止日期。需要提取出数据集的起始日期和终止日期:

     # 提取起始日期和终止日期

    start_date = str(int(data[0,0])) + '-' + str(int(data[0,1]))

    end_date = str(int(data[-1,0] + 1)) + '-' + str(int(data[-1,1]% 12 +1))

(3)提取出数据后,我们可以用pandas模块自动生成连续月的序列,当然,也可以生成其他方式。

   # 创建以月为间隔的变量

   dates = pd.date_range(start_date, end_date, freq='M')

(4)将数据绑定到第3步提取的序列中。

   # 将日期转换成时间序列

   data_timeseries1= convert_data_to_timeseries(input_file, 2)

   data_timeseries2= convert_data_to_timeseries(input_file, column_num)

(5)绘出数据。

   data_timeseries2.plot()

   plt.title('Data(%s-%s)'%(start_date,end_date))

   plt.show()

顶一下
(0)
0%
踩一下
(0)
0%
相关评论
我要评论
用户名: 验证码:点击我更换图片