1. 导数的悖论
“So far as the theories of mathematics are about reality, they are not certain; so far as they are certain, they are not about reality.” — Albert Einstein
关于导数,人们通常认为它测量的是“ 瞬时变化率”。然而,这种说法本身存在一定的矛盾:变化需要在不同的时间点之间发生,而“ 瞬时” 意味着没有时间间隔,因此变化无从谈起。实际上,所谓的瞬时变化率本质上是一段极短时间内的平均变化率。导数正是通过极限的方式将这一微小时间间隔内的变化率定义为瞬时变化率,其数学表达式如下:
$$
\frac{ds}{dt}(t) = \frac{s(t + dt) - s(t)}{dt}
$$
其中,\(dt\) 是一个有限小的量,虽然它不等于零,但非常接近于零。这种定义的优势在于,如果 \(dt\) 是一个确定的有限值,那么计算瞬时变化率的公式会变得非常复杂。例如:
$$
\frac{d(t^3)}{dt} = \frac{t^3+3t^3+3t(dt)^2+(dt)^3-t^3}{dt}
$$
然而,如果 \(dt\) 是一个趋于零的量,那么就可以得到更加简洁的表达式:
$$
\frac{d(t^3)}{dt} = 3 t^2
$$
这正是微积分实用性的精髓所在:通过极限的思想,将复杂的变化率问题简化为易于处理的数学形式。
2. 用几何来求导
在大部分时间都要纠缠于抽象函数的导数,而不是考虑实实在在的变化率问题,这是因为许多现实世界中的现象或需要解决的问题都需要用到多项式,三角函数,指数函数或其他的纯函数来描述,因此假如能够熟练掌握抽象函数的变化率思想,那你就学到了如果精准描述事物变化率的语言。
但是要把这个过程说的像是要记住一系列公式的话,那么就很容易忘记。导数的实质是要看某个量的微小变化,以及它和它所导致的另一个量的微小变化有什么关系。接下来将会讲述如何可视化又直观的考虑其中的一些导数公式。
2.1 \(~x^2\) 的导数
首先让我们从几何的角度来理解函数 \(f(x) = x^2\) 的导数。直观上,\(x^2\) 可以表示一个边长为 \(x\) 的正方形的面积。假如给 \(x\) 一个微小的增量 \(dx\) ,那么正方形面积会增加多少?这个面积的增量就是 \(df\),即由 \(x\) 的微小增量 \(dx\) 引起的 \(f(x)=x^2\) 的值的微小增加量。

具体来说,面积的增量由三部分组成:所以它们组成了 \(2x\text{d}x + (\text{d}x)^2\) 的新面积。根据定义 \(dx\) 实际上是一个非常非常微小的值。 因此可以忽略掉任何包含多余一个 \(\text{d}x\) 的项。 所以最终得到的 \(df\) 就是:
$$
\text{d}f = 2x\text{d}x
$$
从而可以计算得出 \(f(x) = x^2\) 的导数。
$$
\frac{\text{d}f}{\text{d}x} = 2 x
$$
2.2 \(~x^3\) 的导数
同样地,可以从几何的角度来理解函数 \(f(x) = x^3\) 的导数。\(x^3\) 可以表示一个边长为 \(x\) 的立方体的体积。当给 \(x\) 一个微小的增量 \(dx\),立方体的体积变化量可以通过以图 2 直观地表示:

从图中可以观察到,体积的主要变化来自三个互相垂直的外扩正方形面。因此,我们可以近似计算体积的增量 \(df\) 为:
$$
\text{d} f = 3x^2 \text{d}x
$$
从而可以计算得出 \(x^3\) 的导数。
$$
\frac{\text{d}f}{\text{d}x} = 3x^2
$$
2.3 \(~x^n\) 的导数
在现实中,你不需要在每次求 \(x^2\) 的导数时都要想象一个正方形,在求 \(x^3\) 的导数的时候想象一个正方体。因为这两者都遵循一个关于幂函数的规律
$$
\frac{d(x^n)}{dx} = nx^{n-1}
$$
让我们来思考一下为什么幂函数求导也适用于 2 和 3 以外的指数。假如稍微增加 \(x\) 到 \(x+dx\), 那么想要求出 \((x+dx)^n\) 的函数值就需要把这 \(n\) 个 \(x+dx\) 全部乘到一起。这个完整的展开式会很复杂,但是求导的一个关键点就是很大一部分项可以被忽略。
$$
\begin{aligned}
(x+dx)^n &= \overbrace{(x+dx)(x+dx)…(x+dx)} ^{n个}\\
&= x^n + nx^{n-1}dx+(…)dx^2
\end{aligned}
$$
将 \(dx^2\) 及更高次项忽略就可以得到 \(d{(x^n)}\) 的近似关系:
$$
d(x^n) = nx^{n-1}dx
$$
这就推导出了幂函数的求导公式。由此可见,幂函数的求导法则在更一般的情况下依然成立。
2.4 \(~1/x\)的导数
现在考虑 \(\frac{1}{x}\) 的导数。一方面讲,可以简单粗暴地尝试应用幂函数求导公式。那么现在让我们看看能不能从几何的角度去考虑这个问题,而不是单单把它代入到公式中。
\(\frac{1}{x}\) 的值也就是在问“ 什么数乘以 \(x\) 等于 \(1\)?”。 从几何角度上,可以想象在二维平面上面积为 \(1\) 的长方形。假设它的宽度是 \(x\),那么它的高度必然就是 \(\frac{1}{x}\)。假设给 \(x\) 一个微小的增量 \(dx\),那么想让长方形的面积保持为 \(1\) 的话,它的高度应该如何变化呢?

显然,增加了 \(dx\) 的宽度就会在右边的位置增加一点新的面积,所以原本矩阵的高度就需要按照 \(d(1/x)\) 减少,使得顶部面积的减少会与右边面积增加相抵。那么就可以得到如下关系:
$$
\begin{aligned}
x\text{d}(1/x) &= \frac{\text{d}x}{x} \\
\frac{\text{d}(1/x)}{\text{d}x} &= \frac{1}{x^2}
\end{aligned}
$$
得到 \(1/x\) 的导数结果与幂函数求导法则得到的结果一致。
2.5 \(~\sqrt{x}\)的导数
同样,我们可以通过几何方法求解 \(\sqrt{x}\) 的导数。考虑如图 4 所示的正方形,其面积为 \(x\)。如果对面积 \(x\) 施加一个微小的增量 \(\text{d}x\),则对应的正方形边长的增量即为 \(\text{d}\sqrt{x}\)。

由面积变化的关系可得,新增的面积 \(\text{d}x\) 由两侧的小矩形面积及右下角的小正方形面积之和组成,因此有:
$$
\text{d}x = 2\sqrt{x}\text{d}\sqrt{x} + (\text{d}\sqrt{x})^2
$$
忽略 \((\text{d}\sqrt{x})^2\) 这一高阶小量,并整理得:
$$
\frac{\text{d}\sqrt{x}}{\text{d}x} = \frac{1}{2\sqrt{x}}
$$
这一结果与幂函数求导法则一致,进一步验证了其正确性。
2.6 \(~\sin (\theta)\) 的导数
最后,我们来探讨三角函数的导数,以正弦函数为例。首先,补充单位圆下的三角函数表示方式:对于某个给定的角 \(\theta\) 值,其对应的 \(\sin(\theta)\) 值即为单位圆上该点到 \(x\) 轴的垂直高度。当 \(\theta\) 增加时,你会不停在圆上行走, 其高度就会在\(-1\)到\(1\)之间上下摆动。

想要对三角函数的导数有一个更准确的认识,就需要看函数的真实含义。 假设在圆周上的一个微小行进量 \(\text{d}\theta\),它将使得 \(\sin{\theta}\) 改变多少?首先,在一个足够大的尺度下,圆看上去就像是条直线,所以我们来考虑图\(6\)这个直角三角形。

其中斜边表示的是圆周上的微小行进量 \(d\theta\),左边的这条表示的是高度的变化量 \(\text{d}(\sin(\theta))\)。这个三角形和这大的三角形相似,所以其上方的小角就等于 \(\theta\)。现在,来想想正弦函数的导数应该等于什么?应该等于 \(\text{d}(\sin(x))/\text{d}x\),根据图中几何关系可知这个比值的结果为 \(\cos(\theta)\)。即:
$$
\frac{\text{d}\sin(x)}{\text{d}x} = \cos x
$$
3. 直观理解加法法则、乘法法则与链式法则
在上一节中,我们通过直观的方法讲解了如何对初等函数进行求导。本节的目标是在此基础上,进一步理解更复杂的组合函数的求导方法。与其机械地记忆每条求导法则的公式,我们将继续从几何的角度出发,探讨每条法则背后的几何意义,以加深对导数本质的理解。
复杂函数可以归结为三种组合函数的基本方法:函数相加,函数相乘以及函数套函数(复合函数)。只要能够掌握了三种组合方式的导数,就能将一个庞大的表达式一层层剥离,一步步求导。
3.1 加法法则
首先来看加法法则,两个函数的和的导数就是它们导数的和。为了证明这一点,我们以函数 \(f(x) = \sin(x) + x^2\) 为例。对于每个变量取值上,你就把 \(\sin(x)\) 和 \(x^2\) 对应的函数值相加。考虑这个函数自变量 \(x\) 的一个微小变化量 \(\text{d}x\),整个函数的变化量记作 \(\text{d}f\),其值应该等于 \(\sin(x)\) 的变化量 \(\text{d}(\sin(x))\) 加上 \(\text{d}x\) 的变化量 \(\text{d}(x^2)\)。

因此可以归纳得到加法法则:
$$
\frac{\text{d}}{\text{d}x}(g(x)+h(x)) = \frac{\text{d}g}{\text{d}x} + \frac{\text{d}h}{\text{d}x}
$$
3.2 乘积法则
乘积法则的情况则有些不同。类似地,我们来通过微小的变化思考原因。这里,使用图像不是可视化的最佳方式,在不同层次的数学中,一个相当常见的做法是:如果要处理两个东西的乘积,通过面积来理解会有好处。让我们以 \(f(x) = \sin(x)x^2\) 为例,考虑 \(x\) 的微小变化 \(\text{d}x\) 将如何影响面积。

根据上图可以计算得到 \(\text{d}f\) 的变化量为:
$$
\begin{aligned}
\text{d}f &= \sin(x)\text{d}(x^2) + x^2 \text{d}(\sin(x)) + (…)(\text{d}x)^2 \\
\frac{\text{d}f}{\text{d}x} &= \sin(x) 2x + x^2 \cos(x)
\end{aligned}
$$
因此可以得到乘法法则:
$$
\frac{\text{d}f}{\text{d}x} = g(x)\frac{\text{d}h}{\text{d}x} + h(x)\frac{\text{d}g}{\text{d}x}
$$
3.3 链式法则
还有一种常见的函数组合方式,它出现得极为频繁,那就是把一个函数塞到另一个里面,也叫做函数复合。例如 \(g(x) = \sin(x), h(x) = x^2\),那么将两个函数复合就能得到:
$$
g(h(x)) = \sin(x^2)
$$
现在我们从数轴的角度来分析复合函数如何求导。

想要计算导数,还是要让 \(x\) 的值稍稍变化 \(dx\) 的量,它所导致的第二个值的变化量,即 \(dx\) 引起的 \(x^2\) 的变化就是 \(d(x^2)\),将其展开就可以得到 \(2x\text{d}x\)。同样考虑 \(\text{d}(x^2)\) 的变化量对 \(\sin(x^2)\) 的变化,即为 \(\text{d}(\sin(x^2))\),将该式展开可得:
$$
\text{d}(\sin(x^2)) = \cos (x^2) \text{d}(x^2) = \cos(x^2) 2x \text{d}x
$$
因此可以归纳总结出复合函数的求导法则,其又被称为“ 链式法则” 。
$$
\frac{\text{d}}{\text{d}x} g(h(x)) = \frac{\text{d}g}{\text{d}h}(h(x))\frac{\text{d}h}{\text{d}x}(x)
$$
该式子是在描述输出量 \(g\) 的微小变化除以 \(h\) 的微小变化是多少,然后乘以 \(h\) 的微小变化与 \(x\) 的微小变化的比值,这些 \(\text{d}h\) 最终将会消去,结果就是输出值 \(g\) 的微小变化与输入值 \(x\) 的微小变化的比值。
4. 指数函数求导
这一节中来谈一谈诸如 \(2^x, 7^x\) 之类的函数的导数,并阐明为什么 \(e^x\) 是指数函数中最重要的一个。 我们以 \(M(t) = 2^t\) 为例子,根据导数的定义计算其导数为:
$$
\frac{\text{d}M}{\text{d}t}(t) = \frac{2^{t + \text{d}t - 2^t}}{\text{d}t} = \frac{2^t2^{\text{d}t}-2^t}{\text{d}t} = 2^t(\frac{2^{\text{d}t} - 1}{\text{d}t})
$$
从上式可以看出,右边括号中的项与 \(t\) 无关。当 \(\text{d}t\) 取极小值时,该项会趋近于一个特定的常数,大约为 \(0.6931472…\)。
这个性质并不是 \(2^t\) 独有的,如果尝试替换成其他函数,例如 \(3^t\),能够发现这个常数变成了 \(1.0986…\)。那么,从根本上来看,这些“ 神秘常数” 到底从何而来?是否存在某个特殊的底数,使得导数中的这个系数恰好等于 \(1\) 呢?换句话说,是否有某个 \(a\) 使得 \(a^t\) 的导数不仅仅与自身成比例,而是完全等于自身?
有的兄弟有的,它就是特殊的常量 \(\text{e}\),大约是 \(2.71828…\)。事实上,常数 \(\text{e}\) 并不是碰巧出现在这里的,\(\text{e}\) 的诞生正是源于这种自然增长的数学需求,使得指数函数 \(e^t\) 拥有最简洁、最优雅的导数公式:
$$
\frac{\text{d}}{\text{d}t} e^t = e^t
$$
现在,我们可以借助 \(e\) 来进一步研究那些导数与自身成正比的函数。根据链式法则,可以推导出以下公式:
$$
\frac{\text{d}(e^{ct})}{\text{d}t} = ce^{ct}
$$
接下来,我们将 \(2\) 重新表达为 \(e^{\ln 2}\),这一转换正是基于自然对数的定义。因此,可以将 \(2^t\) 改写为:
$$
2^t = e^{\ln(2)t}
$$
此时,根据上面推导出的导数公式,我们可以得到:
$$
\frac{\text{d}}{\text{d}x} 2^t = \ln(2) 2^t
$$
其中,\(\ln(2)\) 的数值正是先前计算出的神秘常数 \(0.6931472…\)。这表明,不同底数的指数函数,其导数中的比例因子正是该底数的自然对数。至此可以归纳得到指数函数的求导公式:
$$
\frac{\text{d}(a^x)}{\text{d}x} = \ln(a) a^t
$$
5. 隐函数求导
5.1 求圆切线问题
这一节我们来谈一谈什么是隐函数求导,我们从 \(xy\) 直角坐标系的原点为圆心做一个半径为 \(5\) 的圆说起。这个圆可以用如下等式表示:
$$
x^2 + y^2 = 5
$$
即这个圆上所有的点离原点的距离都是 \(5\) 。

我们对等式两边微分可得:
$$
\begin{aligned}
2x\text{d}x + 2y\text{d}y &= 0 \\
\frac{\text{d}y}{\text{d}x} = -\frac{x}{y}
\end{aligned}
$$
在求解圆上某点的变化率时,我们面临一个不同于传统微积分中切线斜率的问题。由于圆的方程不是一个单变量函数,它无法通过单纯的求导来描述自变量的微小变化如何影响函数值的微小变化。因此,我们需要引入新的方法来处理这一类问题。在正式解决圆上点的变化率之前,我们先来看一个相关的变化率问题。
5.2 梯子滑动问题
现在有一把 \(5\) 米长的梯子斜靠在墙上,梯子的顶端开始以 \(1\) 米每秒的速度下滑,请问在这一开始的瞬间,梯子底端离开墙角的速度是多少?为了解决这个问题,我们令梯子顶端离地的距离标积为函数 \(y(t)\),底部离墙的距离就标积为函数 \(x(t)\),两个函数可由一个关键等式联系起来:
$$
x(t)^2 + y(t)^2 = 5^2
$$
现在我们这样考虑求解这个问题,等式的左边我们认为其是一个关于时间的函数,它正好等于一个常数,即它的值是不随时间而改变的,但依然把它写成了一个关于时间的式子。这就表示我们能把它当作关于 \(t\) 的函数对待。对等式两侧对 \(t\) 求导可得:
$$
\begin{aligned}
\frac{d(x(t)^2+y(t)^2)}{dt} &= 0 \\
2x(t)\frac{dx}{dt} + 2y(t)\frac{dy}{dt} &= 0
\end{aligned}
$$
根据上式即可得到梯子底端的速度。
5.3 求切线问题和梯子滑动问题的联系
在解决梯子滑动问题时,我们发现它与求圆的切线问题存在一定的相似性。在这两个问题中,都涉及到同一个等式: \(x^2 +y^2 = 5^2\)。在求解时,我们的策略都是对这个等式的两边求导。然而,二者在求导时的背景有所不同。
在梯子滑动问题中,\(x\) 和 \(y\) 都是关于时间 \(t\) 的函数,即 \(x = x(t)\)、\(y = y(t)\)。对等式两侧求导的过程实际上是在研究变量随时间的变化率,因此微分具有清晰的物理意义。
然而,在求圆的切线问题时,我们并没有显式地引入时间 \(t\),而是直接研究变量 \(x\) 和 \(y\) 之间的关系。此时,微分的意义似乎变得不那么直观——我们不再考虑一个微小的时间变化 \(dt\) 如何影响 \(x\) 和 \(y\),而是直接分析 \(x\) 和 \(y\) 的瞬间变化率之间的关系。这种方法实际上对应的是隐函数求导,它帮助我们在不显式引入时间参数的情况下,找到变量之间的变化规律。
接下来,我们就用这种方法来解答圆的切线问题。首先给表达式 \(x^2 + y^2\) 取个名字为 \(S\),其实际上就是取两个变量的函数,对于平面每一点 \(x, y\) 它都会返回一个值。在研究圆的切线时,我们关注的是 \(S\) 在曲线上如何变化。求导的关键在于,我们需要考虑 \(S\) 的两个变量 \(x\) 和 \(y\) 同时 发生微小变化。也就是说,既有 \(x\) 的微小变化量 \(dx\),也有 \(y\) 的微小变化量 \(dy\)。然而,由于这些变化仍然发生在圆上,我们要求它们保持满足原方程 \(S = 5^2\) 的约束,这意味着 \(d(S) = 0\)。

6. 极限
在前面的几个小节中,我们主要讨论了如何求导。而在正式讲解积分之前,我们先补充一个关键概念—— 极限。
极限的基本思想并不陌生,它描述的是一个数值如何逐渐逼近另一个数值。然而,极限不仅仅是“无限接近”这么简单的直觉概念,它还为数学分析提供了严格的基础。接下来,我们将借助极限的定义来解释以下三个关键内容:
- 重新审视导数的定义,并理解其本质;
- 利用极限的 \(\varepsilon - \delta\) 形式化定义,深入剖析“逼近”的精确含义;
- 洛必达法则。
6.1 导数的定义
在极限的框架下,导数的正式定义如下:
$$
\frac{df}{dx}(x) = \lim_{h \rightarrow 0}\frac{f(x + h) - f(x)}{h}
$$
从这个表达式可以看出,右侧的极限形式彻底避免了“无穷小”概念可能带来的悖论。事实上,引入极限的目的正是为了严格定义导数,同时避免逻辑上的矛盾。在理解导数时,不同的人可能会对符号 \(dx\) 产生不同的解读:
- 有人将 \(dx\) 视为一个无穷小的变化量;
- 也有人认为 \(dx\) 和 \(df\) 只是单纯的数学符号,没有特定的数值意义。
实际上,这两种解读都不够严谨。更准确的理解是:\(dx\) 代表一个具体的、有限的变化量,而导数的求解过程关注的是当 \(dx\) 逐渐趋近于零时的极限行为。这种用有限的变化量描述导数的思想,实际上与导数的正式定义是完全等价的。
6.2 极限的定义
以函数 \(\frac{(2 + h)^3 - (2)^3}{h}\) 为例,它的图像看着像是一条连续的抛物线。可以发现这个函数当 \(x = 0\) 时,函数没有定义。但实际上,当输入无限接近 \(0\) 的时候,函数仍然是有定义的。当 \(h\) 逼近于 \(0\) 的时候,函数的值将会逼近于 \(12\),这种结果与函数从哪边逼近无关。
在数学分析中,极限的定义通常采用 \(\varepsilon - \delta\) 语言来表述。在这个例子中,我们讨论函数在 \(0\) 处的极限值为 \(12\)。为了描述任意函数值与 \(12\) 之间的距离,习惯上使用 \(\varepsilon\) 来表示这段距离,并且 \(\varepsilon\) 可以任意小。
极限存在的核心条件是:在 \(0\) 的邻域内,始终可以找到一个 \(\delta\),使得当自变量落在 \(0\) 附近、距离不超过 \(\delta\) 时,函数值始终处于 \(12\) 的 \(\varepsilon\) 邻域内。关键在于,这种情况对于任意小的 \(\varepsilon\) 都成立,即无论 \(\varepsilon\) 取多小,总能找到合适的 \(\delta\),确保函数值保持在 \(12\) 的 \(\varepsilon\) 范围内。

6.3 洛必达法则
假设要求解如下极限值:
$$
\lim_{x \rightarrow 1} \frac{\sin(\pi x)}{x^2 - 1}
$$
通过代入 \(1\) 可以发现 \(\frac{\sin(\pi)}{1^2-1} \rightarrow \frac{0}{0}\)。想要求解这个极限就需要用到导数。考虑某个微小的变化量 \(dx\) 对其的影响,\(\sin(\pi x)\) 会减少,变化量 \(dx\) 对函数造成的影响就是这个函数值的变化量,称为 \(d(\sin(\pi x))\),根据链式法则微分得到 \(\cos(\pi x)\pi dx\)。同样的 \(x^2 - 1\) 的图像变化量为 \(d(x^2 - 1)\),微分得到 \(2xdx\)。因此可以得到:
$$
\lim_{x \rightarrow 1} \frac{\sin(\pi x)}{x^2 - 1} \approx \frac{-\pi dx}{2dx} = \frac{-\pi}{2}
$$
归纳以上的推导过程就可以得到洛必达法则的一般形式:
$$
\lim_{x \rightarrow a}\frac{f(x)}{g(x)} = \frac{f’(a)}{g’(x)}
$$
7. 积分与微积分基本定理
积分本质上是求导的逆运算,我们可以通过一个例子来说明这一点。在前面的小节中,我们利用距离-时间函数的导数得到了速度-时间函数。同样,在当前情境下,如果已知速度函数并希望求得距离-时间函数,本质上就是在思考:哪个函数的导数等于给定的速度函数?
但在此之前,我们首先需要说明这一问题如何与求由速度函数围成的面积相关联。这种联系不仅有助于建立对问题的直观理解,还能为我们探索更广泛的数学概念奠定基础。这类问题统称为“ 积分问题”,它们在数学分析和应用中扮演着至关重要的角色。在速度-时间函数的情境下,求解积分实际上意味着计算物体在某一时间段内所经过的总距离。如果要计算 \(0\sim 8\) 秒经过的距离表示为:
$$
\int_0^8 v(t) dt
$$
其中 \(dt\) 趋近于 \(0\),其在几何上的表现为如下函数图像于坐标轴为围成的面积。

在车速问题的动力学分析中,我们可将时间区间的右端点扩展为自变量 \( T \),从而构建一个以时间为变量的路程函数。具体而言,设速度函数 \( v(t) \) 在时域 \( [0, T] \) 上的积分为:
$$
s(T) = \int_0^T v(t) dt
$$
该积分在几何上表现为速度-时间曲线与横轴所围区域的面积值,其物理意义对应车辆在 \( T \) 秒内的总位移。若对此路程函数进行微分分析,可通过极限过程揭示其导数特性:当时间变量产生微小增量 \( dT \) 时,对应的位移增量 \( ds \) 在数值上等于底为 \( dT \)、高为 \( v(T) \) 的矩形面积,即:
$$
ds = v(T) dT
$$
由此直接导出微分关系:
$$
\frac{ds}{dT} = v(T)
$$
这一结论实质上是微积分基本定理(Fundamental Theorem of Calculus)的具体表现,它严格证明了可积函数 \( v(t) \) 的变上限积分对上限变量的导数等于被积函数在上限处的函数值。更一般地,该定理建立了积分与微分之间的对偶关系:任一连续函数图像下方面关于积分上限的导数,恒等于该函数在积分上限处的取值。
推广至一般情景,对于任意函数 \(f(x)\) 求积分时,你是在把 \(x\) 在一定范围内的所有 \(f(x)dx\) 值加起来,然后求 \(dx\) 趋近于 \(0\) 时,加和趋近的值。求积分的第一步是找原函数,也就另一个函数 \(F(x)\),并满足:
$$
\frac{dF}{dx}(x) = f(x)
$$
则积分值就等于原函数在上限时的值减去下限的值:
$$
\int_a^b f(x)dx = F(b) - F(a)
$$
这就是所谓的微积分基本定理。在积分的过程把面积切分为很小的矩形面积的和的极限,连续的遍历所以矩形面积的值,然而利用原函数求值的时候只关注两个自变量上限和下限。