如何根据 Pr(>F) 过滤模型列表
我运行了一个基本上是这个 的模型 models F) 过滤模型 模型类是list 这是模型的str 的str str(models) List of 248 $ PC1 ~ Sex :Classes ‘anova’ and 'data.frame': 2 obs. of 5 variables: ..$ Df : int [1:2] 1 186 ..$ Sum Sq : num [1:2] 205562 63770 ..$ Mean Sq: num [1:2] 205562 343 ..$ F value: num [1:2] 600 NA ..$ Pr(>F) : num [1:2] 4.34e-60 NA ..- attr(*
0 2024-02-26
编程技术问答社区
自动使用LRT来评估整个因子变量的显著性
r的多变量回归模型的输出(包括一个或多个因子变量)不包括模型中整个因子变量重要性的似然比测试(LRT).例如: fake = data.frame( x1=rnorm(100), x2=sample(LETTERS[1:4], size=100, replace=TRUE), y=rnorm(100) ) head(fake) x1 x2 y 1 0.6152511 A 0.7682467 2 -0.8215727 A -0.5389245 3 -1.3287208 A -0.1797851 4 0.5837217 D 0.9509888 5 -0.2828024 C -0.9829126 6 0.3971358 B -0.4895091 m = lm(fake$y ~ fake$x1 + fake$x2) summary(m) 如果我们想测试模型中整个变量x2的重要性,我们可以拟合减少的模型m.r
0 2024-02-26
编程技术问答社区
方差分析表的 R 显著性代码如何相互转换?
测试数据框架: > foo x y z 1 0.191 0.324 0.620 2 0.229 0.302 0.648 3 0.191 0.351 0.626 4 0.229 0.324 0.630 5 0.152 0.374 0.656 6 0.191 0.295 0.609 7 0.229 0.267 0.665 8 0.152 0.353 0.657 9 0.152 0.355 0.655 两个线性模型: model1 anova(model1,model2) Analysis of Variance Table Model 1: z ~ polym(x, y, degree = 1) Model 2: z ~ polym(x
0 2024-02-26
编程技术问答社区
拟合线性模型/按组进行方差分析
我试图在R中运行anova()并遇到一些困难.这就是我现在所做的帮助我阐明了我的问题. 这是我数据的str(). str(mhw) 'data.frame': 500 obs. of 5 variables: $ r : int 1 2 3 4 5 6 7 8 9 10 ... $ c : int 1 1 1 1 1 1 1 1 1 1 ... $ grain: num 3.63 4.07 4.51 3.9 3.63 3.16 3.18 3.42 3.97 3.4 ... $ straw: num 6.37 6.24 7.05 6.91 5.93 5.59 5.32 5.52 6.03 5.66 ... $ Quad : Factor w/ 4 levels "NE","NW","SE",..: 2 2 2 2 2 2 2 2 2 2 ... 列r是一个数值值,指示单个图的字段中的哪一行 C列是一个数值值,指示单个图属于哪个列 四列四列对应于
0 2024-02-26
编程技术问答社区
带有管道和GridSearchCV的StandardScaler
我将标准标准器放在管道上,并且 cv_mlpregressor.predict(x_test)的结果很奇怪.我认为我必须从标准标准中带回值,但仍然无法弄清楚. pipe_MLPRegressor = Pipeline([('scaler', StandardScaler()), ('MLPRegressor', MLPRegressor(random_state = 42))]) grid_params_MLPRegressor = [{ 'MLPRegressor__solver': ['lbfgs'], 'MLPRegressor__max_iter': [100,200,300,500], 'MLPRegressor__activation' : ['relu','logistic','tanh'], 'MLPRegressor__hidden_layer_sizes':[(2,), (4,),(2,2),(4,4
6 2024-01-26
编程技术问答社区
带有params=True的Altair回归转换:当有多个组时,如何访问r²和coeffs?
我正在使用transform_regression在图表中创建一个回归线和相应的方程式文本.对于单个回归,这可以正常工作,但是使用Set groupby=['something']选项,文本将彼此绘制. 我尝试使用lineBreak='\n'构造字符串,但这无济于事. 此外,它还为名为undefined的方程式创建了一个自己的颜色组,这不是很实际.有什么办法避免这种情况?我知道 this 问题,但是我不想更改名称,我宁愿完全不给它一个. 这是一个示例: import altair as alt import altair_transform import pandas as pd import numpy as np np.random.seed(42) x = np.linspace(0, 10) y = np.e ** (-0.1 *x) + np.random.randn(len(x)) / 5 group = np.random.choice(['a','b
0 2024-01-24
编程技术问答社区
altair: 在回归中访问r平方值
我正在使用此示例 https://altair-viz.github.github.io/USER_GUIDE/transform/Regression.html 用于绘制Altair的回归趋势线. import altair as alt import pandas as pd import numpy as np np.random.seed(42) x = np.linspace(0, 10) y = x - 5 + np.random.randn(len(x)) df = pd.DataFrame({'x': x, 'y': y}) chart = alt.Chart(df).mark_point().encode( x='x', y='y' ) chart + chart.transform_regression('x', 'y').mark_line() 此外,我想将rsquared-value作为文本添加到图表.如何访问该值? 根据文档,应
2 2024-01-24
编程技术问答社区
c++中的多变量线性回归
我有一个矢量A [A1,A2,A3]和B [B1,B2,B3].我想找到一个"相关"矩阵X(3x3),该矩阵可以从A'的新传入数据中进行预测,以产生B'的输出预测.基本上是:a'*x要获得b'. 我有许多A和B的记录数据(配对).根据下面的答案(我同意),我认为这是多元线性回归.我认为应该有常见的库这样做,但是我对多元线性回归的了解不足以实施它们.我也不知道要使用哪种算法和库. 给定, b1 = x1_1*a1 + x2_1*a2 + x3_1*a3 + e1 b2 = x1_2*a1 + x2_2*a2 + x3_2*a3 + e2 b3 = x3_1*a1 + x3_2*a2 + x3_3*a3 + e3 在每种情况下进行多个线性回归并将解决方案组合在一起是否有意义?如果不是,为什么不呢? 解决方案 这不是多元回归,而是多元回归.基本上,这可以看作,好像是要估计三个多元回归模型 b1 = t1_1* a1 + t2_1 * a2 + t3_1 *
8 2024-01-23
编程技术问答社区
在大型数据集上有效地计算分段式回归
i当前有一个大数据集,我需要为其计算分段回归(或以某种相似的方式拟合分段线性函数).但是,我既有大数据集,也有大量的零件. 目前我有以下方法: 让S i 成为段的末端i 让(x i ,y i )表示i-th数据点 假设数据点x k 位于段​​j中,然后我可以从x k 创建一个向量为 (S 1 ,s 2 -s 1 ,s 3 -s 2 ,...,x k -s j-1 ,0,0,...) 要在数据点上进行分段回归,我可以对每个向量进行正常的线性回归. 但是,我目前的估计表明,如果我以这种方式定义问题,我将获得约600.000个向量,每个向量约为2.000个组件.我还没有进行基准测试,但是我认为我的计算机在任何可接受的时间内都无法计算出如此大的回归问题. 是否有更好的方法来计算这种回归问题?一个想法是可能使用某种层次结构方法,即通过组合多个段来计算一个回归问题,以便我可以确定此集合的启动和终点.然后计算此组段的单个分段回归.但是,我无法弄清楚如何计算此
4 2024-01-23
编程技术问答社区
通过最小化正交距离实现最佳拟合平面
i具有一组点(以 x1,y1,z1 ... xn,yn,zn,zn )的形式获得.我想通过最小化正交距离找到最佳拟合的3D平面. x,y,z 坐标是独立的,我想为平面方程ax + by + cz + d = 0获得系数a,b,c,d. 获得A,B,C,D? 的算法是什么 注意:在上一篇文章正方形的感觉,通过考虑 z 协调 x,y 的线性函数.但是这不是我的情况. 解决方案 从内存中,这变成了特征向量问题.从一个点到平面的距离与ax + by + cz + d成正比 - 看到这一点的一种方法是指出平面的正常值是(a,b,c).常数D是脖子上的疼痛. 然后,您发现要最小化sum_i(x_i.a)^2,其中a是3矢量.当然,您可以通过将A的所有组件乘以某个小标量来使这个任意的小,因此您希望将此主题最小化,以将其最小化. || a ||^2 = 1,通过制造单位向量来理解比例. (x_i.a)^2 = a'(x_i'x)a,所以您要最小化 a'(sum_i(x_i'x_i
0 2024-01-23
编程技术问答社区
拟合抛物线与点集合的最快方法?
给出了一组要点,什么是适合抛物线的最快方法?是进行最小二乘计算还是有迭代的方式? 谢谢 编辑: 我认为梯度下降是必经之路.最小二乘计算本来会增加一些税收(必须进行QR分解或使事情保持稳定). 解决方案 如果这些点没有错误相关,您可以插入三个点.否则最小二乘 或任何等效的配方> 其他解决方案 我最近需要找到一个通过3分的抛物线. 假设您有(x1,y1), (x2,y2) and (x3,y3),您想要抛物线 y-y0 = a*(x-x0)^2 通过它们:查找y0, x0, and a. 您可以执行一些代数并获得此解决方案(提供点并不全部在线上): let c = (y1-y2) / (y2-y3) x0 = ( -x1^2 + x2^2 + c*( x2^2 - x3^2 ) ) / (2.0*( -x1+x2 + c*x2 - c*x3 )) a = (y1-y2) / ( (x1-x0)^2 - (x2-x0)^
0 2024-01-22
编程技术问答社区
曲线拟合3D数据集
2D数据的曲线拟合问题是众所周知的(LOWESS等),但是给定一组3D数据点,我如何将3D曲线(例如平滑/回归样条)适合此数据? 更多:我正在尝试找到一条曲线,拟合尚无已知关系的向量X,Y,Z提供的数据.本质上,我有一个3D点云,需要找到3D趋势线. 更多:对于歧义,我深表歉意.我尝试了几种方法(我仍然没有尝试修改线性拟合),而随机的NN似乎可以很好地奏效.即,我从点云中随机选择一个点,找到邻居的质心(在任意球体内),迭代.将质心连接以形成光滑的样条很困难,但获得的质心是可以通过的. 为了澄清问题,数据不是时间序列,我正在寻找一个平滑的样条,该样条最能描述点云投影的样条(到2D)将是投影点云的平滑拟合(到2D). img:我包括了一个图像.红点代表从上述方法获得的质心. 3D点云和本地质地http://img510.imageshack.us/img510/img510/2495/2495/40670670670670670670677JPG 解决方案
0 2024-01-08
编程技术问答社区
对多列的时间序列进行线性回归
我有以下问题.我想以矩阵形式计算年度时间序列的回归.我总共有56个时间序列从我想检查的区域的网格点中提取,因此我每年有56个值.我将所有值绘制为数字中的点.现在,我想在此图中添加回归线,其中包含所有数据. 我的目标是计算整个矩阵的回归. library(zoo) pdf(file="/home/user/name.pdf", pointsize=20, onefile = FALSE, width=18, height=11, paper = "special") plot(mat.zoo[,1], pch=20, type="p", ylim=c(8,max(mat.zoo)), yaxt = "n", xaxt = "n", lwd = 1.5, main = "Some title", ylab = "ylabtext", xlab ="", col = "black") tt
8 2023-12-26
编程技术问答社区
滚动回归返回多个对象
我正在尝试基于示例来构建滚动回归函数>,但是除了返回预测值外,我还想返回一些滚动模型诊断(即系数,T值和Mabye R^2).我希望根据结果类型在离散对象中返回结果.上面链接中提供的示例可成功地创建滚动预测,但是我需要一些帮助包装并写出滚动模型诊断: 最后,我希望函数返回三(3)个对象: 预测 系数 t值 r^2 以下是代码: require(zoo) require(dynlm) ## Create Some Dummy Data set.seed(12345) x
6 2023-12-26
编程技术问答社区
R 中的滚动回归 xts 对象
我试图在XTS对象上执行100天的回归,并返回所有日期的坡度系数的t统计量.我有一个XTS对象,价格: > tail(prices) DBC EEM EFA GLD HYG IEF IWM IYR MDY TLT 2012-11-02 27.14 41.60 53.69 162.60 92.41 107.62 81.19 64.50 179.99 122.26 2012-11-05 27.37 41.80 53.56 163.23 92.26 107.88 81.73 64.02 181.10 122.95 2012-11-06 27.86 42.13 54.07 166.30 92.40 107.39 82.34 64.16 182.69 121.79 2012-11-07 27.34 41.44 53.26 166.49 91.85 108.29 80.34 63.84 178.90 124.00 2012-
0 2023-12-26
编程技术问答社区