进给系统是数控机床中将承载切削工具和工件的组件,精确定位到所需位置的重要组成部分,其定位精度和速度直接决定了机床的质量和生产率。进给系统可以通过直线电机直接提供动力,也可以通过旋转电机带动滚珠丝杠和螺母进行驱动。滚珠丝杠是一种将直线运动转换为旋转运动或将旋转运动转换为直线运动的传动装置[1],具有高刚度、高操作可靠性,且能有效减弱惯性和切削力变化对加工精度的影响,因此在数控机床中得到广泛应用[2-4]。滚珠丝杠进给系统由导轨、驱动器、电机、测量系统及其数字控制回路等组成,是一个涉及机械、控制、电气等多个学科领域的复杂系统,其系统综合设计与性能优化面临着诸多挑战。
滚珠丝杠进给系统的动态和静态性能极大地影响定位精度,因此构建精准的模型对于开发高速高精机床至关重要[5-7]。此外,在进行控制参数优化时,一个全面且精准的系统综合模型不可或缺。尽管目前已有大量针对滚珠丝杠进给系统建模及优化设计的研究成果[8-9],但多数研究集中于机械子系统的层面。在这些研究中,非线性摩擦被视为影响进给系统性能的关键因素之一,多种摩擦模型[10-12]被提出,但摩擦模型的核心仍然是由斯特里贝克(Sribeck)曲线所描述的经典模型。机械传动中的间隙问题同样显著地影响着滚珠丝杠进给系统的性能[13-14],现有的研究文献中,用于描述此类间隙的模型主要有磁滞模型、死区模型以及振动冲击模型。振动问题作为影响进给系统性能的另一重要因素,亦受到广泛关注。官鹏飞等[15]提出了一种利用二阶状态观测器的速度扰动观测补偿方法,有效抑制了旋转进给伺服系统中的中频振动。张忠奎等[16]提出将磁流变阻尼器应用于机床滚珠丝杠进给系统轴向抑振,取得良好效果。
上述研究对滚珠丝杠进给系统机械部分的动力学建模进行了详细的研究,但未考虑不同领域之间的耦合效应。实际上,该系统是由多学科领域子系统组成,如机械传动子系统、电气子系统、控制子系统等。这些子系统分属于不同的学科,它们之间存在复杂的耦合关系。滚珠丝杠进给系统的性能不仅取决于子系统的性能,还取决于子系统之间的相互作用。因此,研究系统的动态性能,建立准确的多领域耦合的系统综合模型至关重要。Yang等[17]、Zhang等[18]和Ansoategui等[19]构建了机床进给系统的综合模型,考虑了其多领域耦合特性,但普遍采用传统的基于框图因果连接的建模方法,建模效率低,适用于描述控制系统,但不适合描述复杂多领域耦合系统。Herfs等[20-21]将基于Modelica语言的非因果建模方法应用于进给系统的建模,但是该模型过于简化,与实际系统并不完全一致。
另一方面,控制参数对滚珠丝杠进给系统的性能有重要影响。近年来,许多用于优化PID控制参数的启发式方法,例如遗传算法、模拟退火和粒子群算法[22]等被提出,这些方法在解决复杂的优化问题上取得初步成效。Kashki等[23]提出了一种用于优化PID控制器的强化学习方法,称为连续动作强化学习自动机(continuous action reinforce-ment learning automata, CARLA)。该方法可以克服其他优化技术的一些不足,但其局限性在于必须给出控制参数的初始范围。如果在滚珠丝杠进给系统设计初期就能够对其控制参数进行精确地分析与设定,将有助于减少实验成本并提升设计效率。实现这一目标的前提是拥有一个与实际系统完全匹配、高度精确的系统模型作为支撑。然而目前大多数控制参数分析与整定方法均缺少完整、准确的系统综合模型的支持。
针对滚珠丝杠进给系统所展现的多领域耦合特性,以及目前建模技术在此类复杂系统建模中存在的不足,本文将研究基于Modelica语言的滚珠丝杠进给系统多领域耦合建模方法,并构建一个全面且精准的多领域耦合模型。在此基础上,为进一步解决系统控制参数难以确定的问题,研究融合多领域模型与强化学习的控制参数整定方法,该方法允许通过广泛的模型仿真试验自动学习并优化控制参数。本研究将为滚珠丝杠进给系统设计的早期阶段提供精准的模型支持及性能分析手段,有助于减少实验成本并提升设计效率,具有重要的理论和实际意义。
1 滚珠丝杠进给系统多领域耦合建模
在构建用于评估滚珠丝杠进给系统控制性能的模型时,必须充分考虑该系统的多领域耦合特性。这种综合性考量能捕捉到不同物理领域间复杂的相互作用,有助于深化对系统动态行为的理解与分析,对于确保模型的准确性和全面性至关重要。Modelica语言在多领域耦合建模方面优势明显,本文基于Modelica语言研究滚珠丝杠进给系统多领域耦合建模方法。
Modelica语言是一种面向对象的物理系统建模语言,支持基于方程的组件模型建模以及基于组件模型连接的复杂系统非因果建模。在Modelica语言中,组件模型的接口称为连接器,连接器之间的耦合关系称为连接,连接可以分为因果连接和非因果连接。相同领域组件模型之间通过同类型接口可以直接连接,不同领域类型的接口不可直接相连。
在滚珠丝杠进给系统中,控制子系统内部的关联呈现出因果性特征,而机械及电气子系统内部的关联则体现为非因果性。各学科领域的组成模块均携带有反映其特定领域内交互关系的连接器,这些连接器使不同模块能够相互连接。系统模型的构建过程首先需要利用各组件模型及其内部连接机制来建立各个子系统模型,然后通过子系统模型集成,形成完整的系统综合模型。具体来说,首先对滚珠丝杠进给系统进行系统性解构,将其划分为3大核心组成部分:机械子系统、控制子系统和电气子系统。每个子系统又可被细化为多个基础组件,即最小建模单元,建模流程始于最基础层级的最小建模单元,即组件模型,然后逐层递进,最终形成系统综合模型。建模方法流程如图1所示。
<G:\武汉工程大学\2025\第3期\梅再武-1.tif>
图 1 基于Modelica语言的滚珠丝杠进给系统
多领域耦合建模方法流程
Fig. 1 Process of multi-domain coupled modeling method for the ball screw feed system based on Modelica language
不同领域组件模型的集合共同构筑了一个综合性的滚珠丝杠进给系统多领域模型库,为后续系统综合模型集成提供了丰富的模块化单元。基于模型库,按照各领域子系统组成原理,进行基础组件模型的组合连接,可建立各领域子系统模型。各领域子系统模型通过领域间转换器模型,可进一步集成形成系统多领域耦合模型。领域间转换器包含多个不同领域的接口模型,可实现不同领域子系统模型无缝集成。
基于上述建模方法,采用Modelica语言构建了滚珠丝杠进给系统多领域耦合模型。该模型可以更好地反映系统真实动态行为,其模型结构如图2所示。控制子系统输入连续信号,输出离散脉冲宽度调制(pulse width modulation, PWM)信号,电气子系统接收离散PWM信号,输出扭矩,驱动机械子系统。模型中还包含指令输入模块以及各传感器模型,指令输入模块模型可以加载G代码,并输出工作台指令位置信号;传感器模型用于采集机械及电气信号,包含不同领域类型的连接器,其本身也是领域间转换器模型,起到不同领域模型连接的桥梁作用。
<G:\武汉工程大学\2025\第3期\梅再武-2.tif>[控制子系统][电气子系统][指令
输入][PWM][DC][机械子系统][永磁同步电机模型][光栅传感器模型]
图 2 滚珠丝杠进给系统多领域耦合模型结构
Fig. 2 Structure of the multi-domain integrated model of the ball screw feed system
本文提出的基于Modelica语言的滚珠丝杠进给系统多领域耦合建模方法,是一种面向物理系统的非因果建模方法,相对于传统建模方法,具有建模效率高、多领域无缝集成、无需复杂方程推导等优点,两者之间的对比如图3所示。
<G:\武汉工程大学\2025\第3期\梅再武-3.tif>
图 3 进给系统传统建模方法(a)与多领域耦合建模方法(b)对比
Fig. 3 Comparison of traditional modeling methods (a) and multi-domain coupling modeling methods (b) for the feed system
2 融合多领域模型与强化学习的控制参数整定方法
完整准确的系统模型对于设计高性能的滚珠丝杠进给系统具有重要意义,本文基于滚珠丝杠进给系统多领域耦合模型,开展控制参数分析及整定研究,提出了融合多领域模型与强化学习的控制参数整定方法,其原理如图4所示。该方法主要通过连续迭代学习来调整控制参数,相同的轨迹指令驱动下,系统模型每完成一次仿真,需计算损失函数并确定奖励,然后根据学习算法更新控制参数。将更新的控制参数输入控制系统中,进行下一次的学习更新,通过循环迭代,实现控制参数的整定。
<G:\武汉工程大学\2025\第3期\梅再武-4.tif>
图 4 融合多领域模型与强化学习的控制参数整定方法原理
Fig. 4 The block diagram of the control parameters tuning method based on the integration of multi-domain models and reinforcement learning
传统CARLA算法中,需要为每个待学习参数设定一个合理的取值区间,且区间不宜过宽,否则会导致学习效率低下或学习目标无法实现。然而,在实际应用过程中,确定合理、足够小的参数取值区间常常是一项具有挑战性的任务。为了解决这个问题,本文在CARLA框架下,结合了强化学习的核心理念,将滚珠丝杠进给系统的多领域动态模型作为智能体的学习环境。在此环境中,智能体的动作表现为各种控制参数的不同组合,而控制效果则通过定义的奖励函数来量化评估。
控制参数的调整方法可以分为粗调和精调。粗调的目的是获得最佳控制参数范围,首先在给定的初始范围内以均匀分布的形式随机选择控制参数,经过大量的仿真迭代,获得最佳参数取值区间。精调的目的则是在参数区间内进一步通过学习获得最佳参数组合。
代表滚珠丝杠进给系统控制性能的损失函数定义如下:
[J=0tω1e(t)dt+ω2M+ω3tu] (1)
式(1)中:[t]表示时间,[e(t)]表示进给系统的控制误差,[M]表示超调量,[tu]表示上升时间,[ω1]、[ω2]和[ω3]表示权重值。
通过粗调获得最佳参数取值区间后,在该区间范围内利用混合高斯概率密度函数作为选择准则,对控制参数进行估计,根据式(2)选择每次迭代中的控制参数。
[0xi(k)fi(xi,k)dxi=zi(k)] (2)
式(2)中:k为迭代次数;[xi]为第i个决策变量;[xik]为迭代到第k次[xi]的取值;[fi(xi,k)]为混合高斯概率密度函数;[zi(k)]表示参数被选择的概率,在[0, 1]范围内随机变化。
随着概率密度函数的更新,能够获得较好控制性能的控制参数的概率密度增大,被选择的概率增加。相反,使控制性能降低的控制参数其概率密度降低,被选择的概率变小。
在第k次迭代中,将控制参数导入多领域耦合模型中,通过仿真计算出相应的损失函数值[Jk]。通过将[Jk]与先前迭代的损失函数的最小值[Jmin]和平均值[Jmean]进行比较,可通过式(3)定义增强系数:
[βk=Min1,Max0,Jmean-JkJmean-Jmin] (3)
增强系数[βk]的大小取决于控制性能,如果损失函数值[Jk]小于[Jmin],则给予奖励;如果损失函数值[Jk]大于[Jmean],则惩罚值为0。
计算出[βk]后,则可对每个控制参数的概率密度分布函数进行独立更新,如式(4)所示:
[fi(xi,k+1)=αkfi(xi,k)+βkH(xi,r) ,xi∈Xi 0, xi?Xi] (4)
式(4)中:[αk]为参数分布归一化因子;[Xi]为决策变量[xi]的取值范围;[H(xi,r)]是以动作[r]为中心的对称高斯近邻函数,表达式如下:
[H(xi,r)=ghxi,max-xi,minexp-xi-r22gwxi,max-xi,min2] (5)
式(5)中:[r=xik],表示迭代到第[k]次时采取的动作,[gh]和[gw]分别是高斯函数的归一化高度和宽度,用于确定学习的速度和分辨率;[xi,min]和[xi,max]分别为[xi]的最小值和最大值。
为了确保每个控制参数的概率密度分布函数在其定义区间内积分值为1,归一化因子[αk]定义为:
[αk=1xi,minxi,maxfixi,k+βkHxi,rdxi] (6)
该算法的终止条件是损失函数的平均值[Jmean]收敛到特定值,或者迭代达到一定次数。随着学习过程的推进,以控制参数为中心的高斯函数不断更新每个控制参数的概率密度分布函数,控制参数整定方法的流程图如图5所示。本文研究的融合多领域模型与强化学习的控制参数整定方法,不仅能够自动探索最优的参数值,还能有效克服传统方法中参数区间范围难以确定的问题。
<G:\武汉工程大学\2025\第3期\梅再武-5.tif>
图 5 控制参数整定方法流程图
Fig. 5 Flow chart of control parameters tuning method
3 验证与讨论
3.1 滚珠丝杠进给系统多领域耦合模型实验验证
为了验证滚珠丝杠进给系统多领域耦合模型的准确性,建立了如图6所示的实验平台。图6中,滚珠丝杠工作台的位置指令信号由数控装置给定,伺服电机的三相电压和电流可通过功率分析仪进行测量,伺服电机的角位移可通过光电编码器进行测量,工作台的位置可通过光栅尺进行测量。给定不同类型的位置指令信号,可通过相应的传感器测量工作台的实际位置、速度、加速度以及伺服电机的转矩电流等。
<G:\武汉工程大学\2025\第3期\梅再武-6.tif>[数控装置][功率分析仪][光栅尺]
图 6 滚珠丝杠进给系统实验平台
Fig. 6 Experiment platform of the ball screw feed system
实验平台中的滚珠丝杠进给系统主要参数如表1所示。将这些参数输入滚珠丝杠进给系统多领域耦合模型,并通过指令输入模块导入G代码,使工作台的指令位移按正弦规律随时间变化,其最大进给速度分别设置为3 000、4 000、5 000和6 000 mm/min,行程设置为100 mm,4种速度分别简记为F3000、F4000、F5000、F6000,通过多领域集成仿真得到工作台实际位移的仿真数据。
将相同的G代码输入实验平台中的数控装置,使工作台按正弦规律运动,通过传感器采集实验数据。随后将工作台位置跟踪误差仿真数据与相应的实验测量数据进行对比,并计算两者之间的偏差,如图7所示。由图7可知,偏差呈正弦规律变化,并且随着进给速度的增加,偏差也在增大。这可能是由于随着进给速度增加,系统非线性效应更加明显,系统参数(如刚度、摩擦系数等)发生改变,而模型暂未考虑参数的不确定性。
为了定量比较工作台位置跟踪误差的实测结果与仿真结果之间的偏差,采用最大绝对误差(max absolute error, MAE)、均方根误差(root mean square error, RMSE)和相对误差(relative error, RE)对偏差进行评估。表2中给出了多领域耦合模型的实验测量准确度。结果表明,工作台位置跟踪误差模型仿真结果与实测结果之间的最大偏差均在6.8 μm以下,模型预测的跟踪误差的RMSE均在2.7 μm以下,并且随着进给速度的增加,RE逐渐减小。实验结果表明本文所建立的滚珠丝杠进给系统多领域耦合模型具有较高的准确度。
表2 不同进给速度下多领域耦合模型的仿真精度
Table 2 Simulation accuracy of the hybrid model at different feed rates
[最大进给速度 MAE / [μm] RMSE / [μm] RE / % F3000 5.98 1.72 1.1 F4000 5.27 1.41 0.7 F5000 4.55 1.64 0.5 F6000 6.79 2.63 0.6 ]
3.2 控制参数整定方法验证
滚珠丝杠进给系统准确有效的多领域耦合模型,为设计阶段对该系统进行深入分析与评估提供了强有力的支撑。为了验证融合多领域模型与强化学习的控制参数整定方法的有效性,基于已验证的多领域耦合模型,利用强化学习方法进行控制参数的整定和优化分析。
为了观察控制系统的性能,将阶跃信号作为进给系统的指令信号。需要调整的控制参数是速度环中PI控制器的比例系数[Kps]和积分系数[Tis],以及电流环中PI控制器的比例系数[Kpc]和积分系数[Tic]。在第一轮粗调之后,可以获得每个控制参数的区间范围(如表3所示),然后在获得的区间范围内通过迭代学习得到最佳控制参数。经过1 000次迭代学习后,损失函数[Jcost]的变化如图8所示。
表3 控制参数范围和最佳值的训练结果
Table 3 The training results of the range and optimal value of the control parameters
[控制参数 区间范围 最佳值 [Kps] [2, 10] 6.22 [Tis] [0.005, 0.100] 0.015 6 [Kpc] [190, 210] 204.34 [Tic] [0.5, 0.9] 0.822 ]
<G:\武汉工程大学\2025\第3期\梅再武-8.tif>[0 250 500 750 1 000
k][653
648
643][Jcost]
图 8 [Jcost]随迭代次数的变化
Fig. 8 The variation of [Jcost] with the number of iterations
从图8中可以看出,随着迭代次数的增加,[Jcost]减小并最终收敛。每个控制参数的概率密度函数的变化如图9所示,其中[f(Kps,k)]表示控制参数[Kps]的概率密度函数,其他控制参数概率密度函数表示方法依此类推。从图9中可以看出,随着迭代次数的增加,控制参数概率密度分布会收敛到特定的分布。
随着迭代的增加,控制参数最终收敛到某个值,每个控制参数随着迭代次数的变化如图10所示。从图10中可以看出,电流环的比例系数和积分系数的收敛速度比速度控制环的收敛速度更快。在滚珠丝杠进给系统多领域耦合模型的基础上,采用本文提出的控制参数整定方法,在输入阶跃信号时获得了最优的控制参数,验证了本文所提出方法的有效性。表3中显示了学习到的最佳控制参数。类似地,可以使用控制参数整定方法来优化和分析不同工作条件下的控制参数。
4 结 论
针对滚珠丝杠进给系统中存在的多领域耦合特性,本文首先研究了基于Modelica语言的滚珠丝杠进给系统多领域耦合建模方法。该方法能够实现多领域模型无缝集成,避免复杂人工方程推导,从而提高建模精度和效率。实验结果表明,基于该方法构建的模型跟踪误差预测结果与实验数据高度一致,模型精准性良好,证明了方法的有效性。在此基础上,本文进一步提出了融合多领域模型与强化学习的控制参数整定方法。该方法采用自学习机制,以系统控制性能为优化目标,通过大批量仿真迭代学习,自动获取最优控制参数组合,从而提高进给系统的设计与分析效率。
滚珠丝杠进给系统多领域耦合建模能实现系统模型的精准构建,融合多领域建模与强化学习的控制参数整定方法能通过智能化调节策略,优化系统控制参数,进而指导滚珠丝杠进给系统的设计与开发过程,确保其满足高性能、高精度的应用需求。本文的研究为滚珠丝杠进给系统的综合设计和性能优化提供了一种新的视角,具有重要的理论意义与实用价值。