光子概念由爱因斯坦在1905年至1917年间提出,当时普遍接受的“光是电磁波”的经典电磁理论无法解释光电效应等实验现象。与当时其他半经典理论在麦克斯韦方程组框架内将物质吸收和发射的光的能量量化相比,爱因斯坦首次提出光本身是量子化的,这种光量子(英文:light,德语:das)被称为光子。这一概念的形成导致了许多领域的实验和理论物理的巨大进步,例如激光、玻色-爱因斯坦凝聚态、量子场论、量子力学的统计诠释、量子光学和量子计算等。根据粒子物理标准模型网校头条,光子是所有电场和磁场的起因,它们的存在是满足空间和时间中每一点都具有特定对称性的物理定律要求的结果。光子的固有性质,例如质量、电荷、自旋等,由规范对称性决定。
1905年,青年科学家爱因斯坦发展了普朗克量子理论。他认为电磁辐射本质上是不连续的,无论是原子发射、吸收时,还是传播时。爱因斯坦把它们称为“光量子”光子说,简称“光子”,并用光量子理论解释了光电效应,这成为爱因斯坦获得1921年诺贝尔物理学奖的主要原因。随后,康普顿散射进一步证实了光的粒子性。它表明光不仅在吸收、发射时具有粒子性质,而且在弹性碰撞中也具有粒子性质,是既有能量又有动量的粒子。这样,光既具有波动性(电磁波),又具有粒子性(光子),即具有波粒二象性。后来,德布罗意把波粒二象性推广到一切理论微观粒子。
光子的能量ε=hν,动量p=hν/c,是自旋为1的玻色子,是电磁场的量子,是电磁相互作用的传播子。原子中的电子发生能级跃迁时,会发射或吸收能量等于它们能级差的光子,正负粒子相遇时就会湮灭,转变成若干个光子。光子本身不带电,其反粒子为自身。光子的静质量为零,无论观察者的运动状态如何,它们在真空中总是以光速c运动。由于光速不变性的特殊重要性,它成为建立狭义相对论的两个基本原理之一。
光子和其他量子粒子一样,具有波动性和粒子性的双重性质:光子可以表现出经典波的折射、干涉和衍射(关于光子的波动性是经典电磁理论所描述的电磁波的波动性,还是量子力学所描述的概率波的波动性,请参考下文的波粒二象性和不确定性原理);而光子的粒子性则在于,在与物质相互作用时,与经典波不同,光子不能转移任何大小的能量,而只能转移量化的能量。对于可见光来说,单个光子携带的能量约为4×10-19J(焦耳),足以激发眼睛中感光细胞的一个分子,从而引起视觉。光子除了能量之外,还具有动量和偏振态。但是,由于量子力学定律的制约,单个光子并不具有确定的动量或偏振态,而在测量其位置、动量或偏振时,只具有获得相应特征值的概率。
光子的概念还被运用到物理学以外的其他领域,例如光化学、双光子激发显微镜以及分子距离的测量等。在当代研究中,光子是研究量子计算机的基本元素,在量子密码等复杂的光通信技术中也有着重要的研究价值。直到18世纪,大多数理论都将光描述为由无数微小粒子组成的物质。由于粒子论无法轻易解释光的折射、衍射和双折射现象,笛卡尔(1637年)、胡克(1665年)和惠更斯(1678年)提出了光的(机械)波动论;但当时由于牛顿的权威影响力,光的粒子论仍然占主导地位。19世纪初,托马斯·杨和菲涅尔的实验清楚地证实了光的干涉和衍射特性。到1850年左右,光的波动论已为学术界充分接受。 1865年,麦克斯韦的理论预言光是一种电磁波,而证实电磁波存在的实验则由赫兹于1888年完成,这似乎标志着光的粒子理论的彻底终结。
但是麦克斯韦理论下的光的电磁理论并不能解释光的所有性质。例如,在经典电磁理论中,光波的能量只与波场的能量密度(光强度)有关,与光波的频率无关;但许多相关实验,如光电效应实验等都表明,光的能量与光强度无关,只与频率有关。类似的例子是,在某些光化学反应中,只有当光的频率超过一定的阈值时,反应才会发生,在阈值以下无论光强度如何增加,反应都不会发生。
与此同时,众多物理学家进行了四十多年(1860-1900)的黑体辐射研究,也因普朗克假说而告终。普朗克提出,任何发射或吸收频率为ν的电磁波的系统,其能量总是E=hν(能量=普朗克常数×频率)的整数倍。爱因斯坦提出的光量子假说,可以成功解释光电效应光子说,爱因斯坦也因此获得了1921年的诺贝尔物理学奖。爱因斯坦理论的先进性在于,在麦克斯韦的经典电磁理论中,电磁场的能量是连续的,可以取任意值。由于物质发射或吸收的电磁波的能量是量子化的,因此众多物理学家试图寻找物质中存在什么样的约束,将电磁波的能量限制在量化的值上;而爱因斯坦则首创了电磁场本身的能量是量子化的思想。爱因斯坦并没有质疑麦克斯韦理论的正确性,但他同时指出,如果麦克斯韦理论中经典光波场的能量集中在互不影响的光量子上,许多类似光电效应的实验就能得到很好的解释。1909年和1916年,爱因斯坦指出,如果普朗克黑体辐射定律成立,那么电磁波的量子必须具有p=h/λ(动量=普朗克常数/波长)的动量,才能使它们具有完美的粒子性质。1926年,康普顿在实验中观测到了光子的动量,康普顿因此获得了1927年的诺贝尔奖。
爱因斯坦等人的工作证明了光子的存在,而随之而来的问题则是:如何将麦克斯韦的光的电磁理论与光的量子理论统一起来?爱因斯坦始终没有找到一个理论把二者统一起来,但现在这个问题的答案已经纳入量子电动力学(量子场论)及其后续理论——标准模型之中。(即:电磁场的量子化)早在1900年,M.普朗克在解释黑体辐射的能量分布时,就提出了量子假说。物质振子与辐射之间的能量交换是不连续的,一块接一块,每一块的能量都是ε=hν;1905年,爱因斯坦进一步提出,光波本身并不是连续的而是具有粒子性质的,爱因斯坦称之为光量子; 1923年,A.H.康普顿成功地用光量子的概念解释了X射线经物质散射时波长改变的康普顿效应,从此光量子概念被广泛接受和应用,并于1926年正式命名为光子。
根据计算:
一个中子的质量为1.(84)×10-27 kg(千克);一个中子的半径为1.(48)fm(费米);
质子的质量:1.(83)×10-27千克;质子的半径:1.(48)fm;
一个电子的质量:9.(45)×10-31kg;一个电子的半径:0.(40)fm;
临界光子的质量:9.(38)×10-36千克;临界光子的半径:0.(29)fm。
临界光子能量:4.(17)×10-19J(焦耳),2.(11)eV(电子伏特);
临界光子频率:6.(26)×(Hz);
临界光子的波长为472.8983(20)nm(纳米),正好处于太阳光谱能量辐射的峰值位置。
当光的质量大于临界质量时,它容易被电子吸收或散射;当光的质量小于临界质量时,它不容易被电子吸收,也就是容易被电子发射出去;而临界质量附近的光子更容易被电子吸收,并向不同方向发射出去,从而形成蓝天。爱因斯坦于1905年提出的光量子理论在二十世纪前二十年被多次用不同的实验方法证实,如罗伯特·密立根的诺贝尔演讲[32]中所述。然而,在康普顿的实验证明光子的动量与其频率成正比[30]之前,大多数物理学家都不愿意相信电磁辐射也有粒子的一面(见维恩[27]、普朗克[29]和密立根[32]的诺贝尔演讲)。考虑到麦克斯韦理论的高度完备性和正确性,这种怀疑是可以理解的。基于这一疑惑,许多物理学家从物质结构上寻找量子化能量被吸收或辐射的未知原因。玻尔、索末菲等人建立了轨道量子化的原子模型,定性地解释了原子谱线的能量量子化和物质对光的吸收或发射;这一原子模型对实际的氢原子符合得很好,但不适用于其他原子。直到康普顿做了自由电子对光子的散射实验后,光本身是量子的理论才被广泛接受(因为电子没有内部结构,光子不可能在电子的不同能级之间跳跃)。
即使在康普顿实验之后,玻尔、克莱默和约翰·斯莱特仍然提出了所谓的BKS(Bohr-)模型[33],意在对麦克斯韦理论框架内解释光量子问题做最后的尝试。这个模型的建立基于两个相当激进的假设:
在物质与电磁辐射相互作用中,动量和能量守恒定律只在取平均值时成立,而在吸收或发射这种微小元过程中则不成立;该假设避免讨论能级跃迁过程中出现的能量不连续现象,而是将其理解为一种持续能量释放的渐进行为。
因果关系定律被抛弃;例如自发辐射过程仅仅是由“虚拟”电磁场引起的辐射。
尽管如此,在改进的康普顿散射实验中,人们得知即使在微小的基本过程中,光子的动量和能量守恒也非常好;并且在康普顿散射过程中,从电子振动到新光子产生,观测到的因果律满足时间达到了10ps(皮秒)。这使得玻尔和他的同事为他们的模型举行了“尽可能光荣的葬礼”[31];然而,BKS模型却启发了海森堡,并帮助他发展了量子力学[34]。
一些物理学家一直致力于建立一个半经典模型,其中电磁场不量化[35],物质遵循量子力学。尽管到了 20 世纪 70 年代,物理学和化学中已经有大量的实验证据支持光子理论,但这些证据不能被视为绝对确凿的;由于这些实验依赖于光与物质的相互作用,足够复杂的物质量子力学理论仍然可能能够解释实验现象。无论如何,20 世纪 70 年代和 80 年代进行的光子关联实验彻底推翻了所有半经典理论的正确性。这些实验的结果无法用任何经典光学理论来解释,因为它们涉及量子测量过程的反关联 ()。1974 年,约翰·克劳斯 (John ) 进行了第一次这样的实验[36],他发现了经典的柯西-施瓦茨不等式的不成立。1977 年, 等人1986 年, 等人在光子反关联实验中简化了 等人的实验方法,消除了实验误差源[38]。2004 年,J. Thorn 等人进一步简化了实验[39]。由此,爱因斯坦关于光的量子化假说得到了充分证实。