python 离散型数据怎么量化

Python021

python 离散型数据怎么量化,第1张

python 离散型数据量化的方法可以采用变量转换方法来解决,分类数据和连续数据需要参与模型计算,并且通常会转换为数值数据。

当然,某些算法允许这些数据直接参与计算,例如分类算法中的决策树和关联规则。将非数字数据转换为数字数据的最佳方法是将所有类别或有序变量的范围从一列多值形式转换为仅包含真值的多列。可以将True值传递给True,False或0、1。这种符号转换方法有时称为真值转换。

具体代码是:

import pandas as pddata = [.

['yellow', 'S', 10.1, 'class1'].

['red', 'M', 13.5, 'class1'].

['red', 'M', 15.1, 'class2'].

['blue', 'XL', 15.3, 'class2'.

df = pd.DataFrame(.

data,columns=['color', 'size', 'prize', 'class'].

python 离散型数据用连续数据处理的方法是:

1、等宽法:若数据区间为0~20,设置箱子个数为4个,则等宽法会将数据装入4个箱子:[0,5],(5,10],(10,15],(15,20],并且可以设置每个箱子的名字,如1、2、3、4。

等宽法缺点是分箱结果会受到最值影响。并且需要人为指定箱子个数,比较依赖于经验。分箱结果会直接影响后续分类、聚类的结果。

2、等频法:等频法是指将一组数据分解成n个部分后,每个部分的记录数量是一样多的。等频法常用pandas库中的qcut()函数进行处理。

python量化交易半个月可以学会的。

如果已经有了Python基础,半个月可以入门的,如果没有Python基础,就先学Python,学一两个月有了基础后,再结合量化交易的模型,边学Python语言,边学以Python实现量化模型,上手也会很快的。

大家可能觉得搞量化的人就是整天和大量数据打交道,用一行行代码写出复杂的模型,然后没完没了地Run,在回测和优化中挣扎,沉浸在数学和统计海洋里的一群人。

实际上,这只是表面现象。虽然每个搞量化的人必须会写代码,也必须具备扎实的数学功底,在开发策略的过程中,的确需要分析大量数据,不断做回测和优化,但是,这一切的背后是强大的金融思维和对金融市场的深刻理解在支撑的。

换句话说,如果你没有经济、金融的完整知识体系和工作经验,或者没有正确的、科学的思维方式,无论数学多么地好,也很可能在做无用功;即便编程多么在行,也只能沦为码农一枚(没有歧视程序员的意思哦)。

反过来说,如果你具备科学的思维和逻辑,并发现了经济、金融的某些规律,想做Quant就不难了。接下来,你只需花点时间学习编程工具,好好利用数据和代码为你实现自己的想法。