计算科学 - 如何建立微分方程组以加快计算速度？ - 吾爱随笔录

如何建立微分方程组以加快计算速度？

计算科学 matlab 颂数值建模微分方程布拉斯

2021-12-19 19:07:28

我已经建立了一个微分方程系统，在离散化 pde 后获得，方法如下

dY(1) =  terms_starty;
dY(end) = terms_endy;
dY(2:end-1) = (1./Vector1).*(Matrix1*Y+Matrix2*Y);

dZ(1) =  terms_startz;
dZ(end) = terms_endz;
dZ(2:end-1) = (1./Vector1).*(Matrix1*Z+Matrix2*Z);

dYZ = [dY dZ];

我正在使用 ode15s 在 MATLAB 中解决上述系统。

odeset('abstol', 1e-10, 'reltol', 1e-9)
[t, s]  = ode15s(@(t,s) factory(t,s), tspan , s0, options);

向量 Y,Z 的大小约为 1200，微分方程的数量约为 2400

总仿真时间约为 570 秒，当

odeset('abstol', 1e-10, 'reltol', 1e-9)

用于错误设置，使用默认错误设置时减少 5 倍。我尝试使用分析器，而 ode 求解器大约需要 508 秒。

我想知道是否有方法可以加快 ode 求解器的计算时间。另外，如果 ode 求解器为矩阵运算调用 BLAS 函数，有人可以澄清一下吗？我正在使用 MATLAB 2019b 版。

编辑：我试图通过jpattern下面的简单示例了解如何生成矩阵

  syms x y z;
    F = [x*y, cos(x*z), log(3*x*z*y)]
    v = [x y z]
    J = jacobian(F,v)

给，

  J =
     
    [           y,   x,           0]
    [ -z*sin(x*z),   0, -x*sin(x*z)]
    [         1/x, 1/y,         1/z]

从 J 我想生成jpattern以下形式的矩阵，

jpattern = 
[ 1,   1,  0]
[ 1,   0,  1]
[ 1,   1,  1]

但是我找不到合适的命令来转换J为jpattern. 基本上，我试图找到一种方法来分配 1 代替J. 关于如何做到这一点的建议将非常有帮助。

EDIT2：我尝试在下面的玩具模型中设置稀疏模式，

x0 = [1 0 0 0 0 0 0 0 0 0]';
tspan = 0:0.01:5;

f0 = fun(0, x0);
J = odenumjac(fun,{0 x0}, f0); 
sparsity_pattern = sparse(J~=0.);
options = odeset('Stats', 'on', 'JPattern', sparsity_pattern);
[t, sol]  =  ode15s(@(t,x) fun(t,x), tspan , x0);
plot(t, sol)

function f = fun(t,x)

mat1=[ 
       1    -2     1     0     0     0     0     0     0     0;
       0     1    -2     1     0     0     0     0     0     0;
       0     0     1    -2     1     0     0     0     0     0;
       0     0     0     1    -2     1     0     0     0     0;
       0     0     0     0     1    -2     1     0     0     0;
       0     0     0     0     0     1    -2     1     0     0;
       0     0     0     0     0     0     1    -2     1     0;
       0     0     0     0     0     0     0     1    -2     1;
       ];

mat2 = [
        1    -1     0     0     0     0     0     0     0     0;
        0     1    -1     0     0     0     0     0     0     0;
        0     0     1    -1     0     0     0     0     0     0;
        0     0     0     1    -1     0     0     0     0     0;
        0     0     0     0     1    -1     0     0     0     0;
        0     0     0     0     0     1    -1     0     0     0;
        0     0     0     0     0     0     1    -1     0     0;
        0     0     0     0     0     0     0     1    -1     0;
        ];

f(1,1) = 0;     
f(2:9,1) = mat1*x + mat2*x;
f(10,1) = 2*(x(end-1) - x(end));
end

不幸的是，我不知道如何修复错误

Not enough input arguments.

Error in Untitled>fun (line 36)
f(2:9,1) = mat1*x + mat2*x;

Error in Untitled (line 5)
J = odenumjac(fun,{0 x0}, f0);

有关如何修复此错误的建议将很有帮助。

我不确定矢量化是否正确。所以我也尝试了以下

function df = fun(t,x)
  global mat1 mat2
  f(1,:) = 0;
  f(2:9,:) = mat1*x + mat2*x;
  f(10,:) = 2*(x(end-1) - x(end));
  df = [f(1, :); f(2:9, :); f(10, :)];
end

这对我也没有帮助。

2个回答

我能想到的一些事情：

使用稀疏矩阵来加速Matrix1和的计算Matrix2dZdY
使用更大的积分容差reltol和abstol，特别是如果您正在寻找稳态解决方案和/或不需要精确解析系统瞬态动态。
您正在使用 ode15s 求解，它是一个隐式积分器，您应该自己提供 ODE 函数的雅可比行列式，因为在这里看起来很简单。这是通过关键字“Jacobian”完成的。
如果 Jacobian 太重而无法导出（可能是更复杂的问题），您至少可以通过关键字“JPattern”指定其稀疏模式。如果雅可比是块对角线，则求解器将能够通过有限差分计算它，而调用次数比考虑密集雅可比（否则为默认值）要少得多。
最后，对函数进行矢量化并将关键字“矢量化”设置为 True。这样，求解器可以一次调用具有多个输入的 ODE 函数并减少一些开销。这对于之前的雅可比计算特别有用。

在这里，我认为代码可以很容易地通过简单地将等式重写为（+ 或 - 对元素操作的一些调整）进行矢量化：

dY(1,:) = ...
dY(end,:) = ...
dY(2:end-1,:) = ...

哦，当然，如果您的问题是非刚性 ODE，只需使用像之类的显式求解器ode45，它们会快得多。除非您想要达到稳态并且初始瞬态很长，在这种情况下，具有较大误差容限的隐式方法可能能够更快地达到稳态，而无需精细解决瞬态。

编辑：如果我误解了您的答案并且您实际上想要运行 2400 个不同的模拟，那么将它们作为单个“大”模拟运行可能不是一个好主意，因为时间步长将受到“最难”解决方案的限制。在这种情况下，另一种选择是使用并行 for 循环（使用parfor）并在多个内核上分别解决每种情况。

编辑2021 年 2 月 15 日关于稀疏 aptternodenumjac的形成，您可以这样做：

f0 = ode(0,y0); % value of your ODE function
J = odenumjac(ode,{0 y0}, f0); ! Computes the Jacobian, assuming it is dense
sparsity_pattern = sparse(Jac~=0.);

然后，您可以在调用 ODE 求解器时将其指定'JPattern', sparsity_pattern为附加选项。Matlab 将利用这种模式的知识通过有限差分更快地逼近雅可比行列式。请注意，在您的情况下，您的雅可比很容易推导，因此您最好通过选项通过函数提供雅可比，Jacobian或者，如果它是常数，则作为常数雅可比 via JConstant。

关于odenumjac近似雅可比的方式，最好的办法是在互联网上查找“雅可比有限差分”以找到更深入的解释，但这是主要原理。你 ODE 函数 $f$ 接受一个输入（状态向量 $x$ ) 大小 $N$ . 一些 ODE 求解器（通常是隐式求解器）需要 Jacobian NxN$ 矩阵）的知识才能计算解。 $\partial_x f` ($

行是的第个分量相对于的每个分量的偏导数的向量。相反，列是的所有分量相对于个分量的偏导数的向量。该列可以通过以下一阶有限差分公式近似： $i$ $\partial_x f$ $i$ $f$ $x$ $i$ $\partial_x f$ $f$ $i$ $y$

(\partial_{x_{i}} f) (x) = \frac{f (x + h e_{i}) - f (x)}{h}

$(\partial_{x_i} f)(x) = \dfrac{f(x+ h e_i) - f(x)}{h}$ 其中，所有分量都设置为零的向量除外第个，它设置为 1。

e_{i} = (0, . ., 0, 1, 0, . .0)

$e_i = (0,..,0,1,0,..0)$

i

$i$

上进行循环，可以近似整个雅可比行列式。这将需要次评估：一次不受干扰地计算，而次评估来计算。 $i$ $N+1$ $f$ $f(x)$ $N$ $f(x+h e_i), i=1..N$

对于稀疏雅可比结构的一般问题（例如离散 PDE），当的分量没有“重叠”影响时，稀疏模式的知识可用于一次执行多个扰动。您可以查看文章“关于稀疏雅可比矩阵的估计”以获取更多信息：http ://www.ii.uib.no/forskningsgrupper/opt/forskning/papers/extern/cpr.pdf $x$ $f$

发布的简单示例并不僵硬，但无论如何我还是将它放在 Julia 中进行展示。我将它修改为一个包含 2 个 PDE 的系统，N=1200并进入 10 毫秒

using ModelingToolkit, LinearAlgebra, BenchmarkTools, DifferentialEquations

# Setup matrices
N = 1200
mat1 = hcat(zeros(N),Tridiagonal(ones(N-1),-2*ones(N),ones(N-1)),zeros(N))
mat1[1,1] = 1
mat1[end,end] = 1

mat2 = hcat(zeros(N),Bidiagonal(-1*ones(N),ones(N-1), :L),zeros(N))
mat2[1,1] = 1

# Define the ODE

function f(du,u,p,t)
    y = @view u[:,1]
    z = @view u[:,2]
    dy = @view du[:,1]
    dz = @view du[:,2]

    dy[1] = 0
    dy[2:end-1] .= mat1*y + mat2*y
    dy[end] = 2*(y[end-1] - y[end])

    dz[1] = 0
    dz[2:end-1] .= mat1*z + mat2*z
    dz[end] = 2*(z[end-1] - z[end])
end
u0 = zeros(N+2,2); u0[1,:] .= 1
tspan = (0.0,5.0)
prob = ODEProblem(f, u0, tspan)

# Accelerate it
sys = modelingtoolkitize(prob)
fastprob = ODEProblem(sys, u0, tspan, jac=true, sparse=true)

# Non-Stiff Choice
# 12.908 ms (1073 allocations: 9.58 MiB)
@btime solve(fastprob,Tsit5(),saveat=0.01,abstol=1e-10,reltol=1e-9)

# Unaccelerated Non-Stiff Choice
# 21.300 ms (9658 allocations: 36.36 MiB)
@btime solve(prob,Tsit5(),saveat=0.01,abstol=1e-10,reltol=1e-9)

# Stiff Choice
# 479.284 ms (21441 allocations: 619.75 MiB)
@btime solve(fastprob,TRBDF2(),saveat=0.01,abstol=1e-10,reltol=1e-9)

# Unaccelerated Stiff Choice
# 15.849 s (1381204 allocations: 385.17 MiB)
@btime solve(prob,TRBDF2(),saveat=0.01,abstol=1e-10,reltol=1e-9)

您可能可以将其修改为原始问题。

其它你可能感兴趣的问题

上一篇我可以使用哪个具有精确解的 2D PDE 来测试/验证我的 FEM-PDE 代码？下一篇scipy odeint：在此调用上完成的工作过多并且对初始值非常敏感