定性变量的数量化方法新探 定性变量数量化方法新探 数据分析必不可少的一环就是定性变量数量化,即把定性变量从实际应用环境中抽象出来,将其表征为定量的模式。然而,找到合适的表征形式并不容易,如何才能有效地实现定性变量数量化方面的研究仍有待于进一步探讨。本文就探索和推进定性变量数量化的新方法做一个探讨。 一、定性变量的特点 定性变量指的是变量的值是非定量和可取到的枚举值,这类变量不是离散变量,也不是连续变量,它可以被枚举,可以组成一列值。定性变量直接表示某件物体的特点,它的值只能是一种特定的分类,例如性别(男、女)、类型(绿色、蓝色)等。 二、数量化方法探索 (1)分类法 分类法可以把定性变量转换为定量变量。它可以采用一种分类型的模式,将所有的定性值编号,以数字的方式表示上述特定的定性变量值,这种模式也称之为“分段法”或“编码法”。但是,它无法捕捉定性变量之间的微妙差异和细微关联,因此可以采用其他更加精细的方法来替代。 (2)假设法 假设法可以通过人们在给定属性下对定性变量的主观判断,尝试作出一些假设来将定性变量转换为定量变量。例如,在某一特定的市场中,我们可以假设客户的深度洞察和紧密程度作为定性变量的定量变量,用0-10的评分来衡量客户的主观需求,有助于进行更精细的定量数据分析。 (3)计算机视觉法 计算机视觉法一般是指把定性变量转换为图像,在分析图像时,机器可以通过计算和自动化把定性变量转换为定量变量,从而实现定量数据分析。由于定性变量的变化通常是有序的、非离散的;如果能够通过计算机视觉技术将定性变量转换为定量变量,可以作为一种优秀的定性变量数量化方法。 (4)特征嵌入法 特征嵌入法是基于非线性模型的非监督学习,它们可以将定性数据以更高维度的表示形式表示出来,通过对定性数据聚类或拆分为多个定量变量,从而可以获得新特征,使得定性变量数量化变得更加准确和实用。 本文来源:https://www.wddqw.com/doc/d83087bd6194dd88d0d233d4b14e852459fb3968.html