服务器之家

服务器之家 > 正文

pandas数据处理之 标签列字符转数字的实现

时间:2021-09-25 00:13     来源/作者:wx740851326

机器学习中,当我们在进行数据预处理的时候,对于标签列非字符的数据,我们往往需要将其转换成字符,因为有的算法可能不支持非数字类型来做特征。

那么怎么快捷地来着这个转换呢,请看我的示例:

1.构建测试数据

?
1
2
import pandas as pd
array = ['good','bad','well','bad','good','good','well','good']

2.数据转换下,并获取标签列的字典

?
1
2
df = pd.dataframe(array,columns=['status'])
status_dict = df['status'].unique().tolist()

pandas数据处理之 标签列字符转数字的实现

3.使用函数进行转换

?
1
df['transfromed']=df['status'].apply(lambda x : status_dict.index(x))

pandas数据处理之 标签列字符转数字的实现

这样,就将标签列处理好了哈

等用完之后,再转回来

?
1
df['transfromed1']= df['transfromed'].apply(lambda x : status_dict[x])

pandas数据处理之 标签列字符转数字的实现

补充:pandas factorize将字符串特征转化为数字特征

将原始数据中的字符串特征转化为模型可以识别的数字特征可是使用pandas自带的factorzie方法。

原始数据的job特征值如下

pandas数据处理之 标签列字符转数字的实现

都是字符串特征,无法用于训练,当然可以单独建立map硬编码处理,但是pandas已经封装好了相应的方法。

?
1
2
data = pd.read_csv("data/test_set.csv")
data["job"] = pd.factorize(data["job"])[0].astype(np.uint16)

pandas数据处理之 标签列字符转数字的实现

以上为个人经验,希望能给大家一个参考,也希望大家多多支持服务器之家。如有错误或未考虑完全的地方,望不吝赐教。

原文链接:https://blog.csdn.net/wx740851326/article/details/101533167

相关文章

热门资讯

yue是什么意思 网络流行语yue了是什么梗
yue是什么意思 网络流行语yue了是什么梗 2020-10-11
2020微信伤感网名听哭了 让对方看到心疼的伤感网名大全
2020微信伤感网名听哭了 让对方看到心疼的伤感网名大全 2019-12-26
背刺什么意思 网络词语背刺是什么梗
背刺什么意思 网络词语背刺是什么梗 2020-05-22
苹果12mini价格表官网报价 iPhone12mini全版本价格汇总
苹果12mini价格表官网报价 iPhone12mini全版本价格汇总 2020-11-13
2021年耽改剧名单 2021要播出的59部耽改剧列表
2021年耽改剧名单 2021要播出的59部耽改剧列表 2021-03-05
返回顶部