如何把你的论文发布到 arXiv

Posted on 六 25 4月 2026 in Tech

Abstract 如何把你的论文发布到 arXiv
Authors Walter Fan
Category Tech
Version v1.0
Updated 2026-04-25
License CC-BY-NC-ND 4.0

论文写完那一刻, 很多人会有一种错觉: 大功告成, 世界只差一个链接就能看到我的智慧结晶了。

现实通常没这么浪漫。投稿期刊要等, 会议审稿要等, 学校归档也要等。科研这事有时像排队打饭, 菜都做好了, 窗口还没开。于是 arXiv 这种预印本平台就变得很有用: 先把研究成果公开出来, 让同行能读到、引用、讨论, 同时保留一个清晰的时间戳。

不过先把话说在前头: arXiv 不是学位论文仓库, 也不是帮你盖章毕业的地方。它更像一个严肃的科研预印本集市。你可以把 thesis 改写成符合学术交流习惯的 paper/preprint 发上去, 也可以提交符合 arXiv 学科范围和格式要求的研究稿件, 但不要把它当作学校论文系统或期刊审稿系统的替代品。

arXiv 是什么

arXiv 是一个开放访问的科研论文分享平台, 1991 年由 Paul Ginsparg 创建。按 arXiv 官方介绍, 它现在覆盖八大领域: physics, mathematics, computer science, quantitative biology, quantitative finance, statistics, electrical engineering and systems science, economics。

它的核心价值很简单:

  • 让研究成果更快被看到
  • 给论文一个稳定的公开页面和 arXiv identifier
  • 支持检索、订阅、API、批量数据访问
  • 为 TeX/LaTeX 论文提供编译和展示服务
  • 由志愿 moderator 做学科相关性和基本学术质量把关

这里有个容易误解的点: arXiv 有 moderation, 但不是 peer review。moderator 会看稿件是否属于相关学科、是否有学术价值、格式是否靠谱、是否有明显抄袭或非科学内容, 但它不会像期刊审稿人那样给你三页意见, 顺便把你脆弱的自尊心按在地上摩擦。

一句话: arXiv 解决的是 "快速公开和长期保存", 不解决 "同行评审和学位认证"。

什么论文适合发

适合发到 arXiv 的, 通常是有明确研究贡献的稿件:

  • 已完成但尚未正式发表的 preprint
  • 已投稿会议或期刊、但不违反出版方政策的版本
  • 已发表论文的允许归档版本, 例如 accepted manuscript
  • 从学位论文中整理出来的一篇或几篇研究论文
  • 有完整问题、方法、实验、结论和参考文献的技术报告

不太适合的内容也要心里有数:

  • 课程作业
  • 研究计划书
  • 新闻评论或观点杂文
  • 没有实质研究内容的介绍文
  • 大段个人宣言、政治表达或营销材料
  • 尚未和导师、合作者、单位确认权利归属的稿件

尤其是学位论文。博士论文、硕士论文往往篇幅很长, 有大量背景、综述、致谢、附录和学校格式要求。直接把整本 thesis 扔上去, 未必是最好的传播方式。更常见也更稳妥的做法是: 拆出其中最成熟的一章或几章, 按论文结构改写成一篇 research article。

提交前先过四道门

1. 权利和时机

先确认你有权提交。

如果论文包含合作者贡献, 要和所有作者确认。若涉及学校、公司、基金、专利或保密协议, 也要先问清楚。做研究不能像写临时代码, 今天 push, 明天再说。论文一旦公开, 时间戳很漂亮, 但有些门也就关上了。

还要检查目标期刊或会议的 preprint 政策。有些出版方允许预印本, 有些对 license、版本、embargo 有要求。arXiv 官方也提醒作者, license 选择不可撤销, 不同 funder 和 journal 的要求可能不同。

2. 账号和背书

你需要注册 arXiv 账号。注册时要填写姓名、机构、机构邮箱等信息; 如果没有机构, 可以填写 Independent。新用户或者第一次向某个分类提交时, 可能需要 endorsement。

endorsement 不是什么神秘仪式, 更像科研社区的入场检查。arXiv 希望确认提交者属于相应学术社区。最自然的背书人通常是导师、同领域教授、合作者, 或者在该领域已经活跃发表过 arXiv 论文的研究者。

这里不要群发骚扰邮件。科研圈不大, 邮件写得像海投简历, 很容易把路走窄。

3. 稿件格式

arXiv 接受多种格式, 但官方明确偏好 TeX/LaTeX。原因也不复杂: 源文件更适合长期保存、重新编译、生成可访问的版本。

如果你的论文本来就是 LaTeX 写的, 不要只上传编译后的 PDF。arXiv 通常希望你提交源文件, 包括:

  • .tex 文件
  • \input\include 引用的章节文件
  • 图片文件
  • .bib.bbl 参考文献文件
  • 自定义 .sty 或宏文件, 如果确实需要

打包时可以用 .zip.tar.gz。文件名尽量朴素, 不要带空格、中文、奇怪符号。咱们平时写代码都知道, 路径和大小写问题最烦人; 到论文提交系统里, 它照样烦人。

如果你的稿件来自 Word 或 Google Docs, 可以提交 PDF, 但要确保 PDF 是机器可读的、字体嵌入完整、图文在同一个 PDF 中。不要提交扫描版。扫描版看着像论文, 本质上是论文的照片, 系统和读者都不太高兴。

4. 元数据

提交时要填写 title、authors、abstract、category 等信息。arXiv 的元数据字段对字符有要求, 常见坑是从 PDF 复制出来的弯引号、长破折号、连字和 Unicode 字符。官方建议很朴素: 如果搞不定, 就手打。

category 要认真选。比如计算机领域里, cs.LG 是 machine learning, cs.CR 是 cryptography and security, cs.DC 是 distributed computing, cs.SE 是 software engineering。选错分类不是大罪, moderator 可能会帮你调整, 但这会增加延迟, 也说明你没有认真给自己的论文找读者。

提交流程

实际操作可以按这个顺序走:

  1. 注册账号, 完成邮箱验证。
  2. 从用户页面点击 START NEW SUBMISSION
  3. 选择学科分类。
  4. 如果系统要求 endorsement, 按邮件提示找合适背书人。
  5. 上传源文件或 PDF。
  6. 点击 Check Files, 让系统识别编译器和顶层 TeX 文件。
  7. 检查编译日志, 预览 arXiv 生成的 PDF。
  8. 填写 title、authors、abstract、comments、category、DOI 等元数据。
  9. 选择 license, 并确认自己有权授予该 license。
  10. 最后提交, 等待 moderation 和公告。

arXiv 的公告有固定节奏。官方说明里, 一般在美国东部时间周日至周四公开新提交, 周五和周六没有公告; 14:00 ET 前完成最终提交, 通常会进入当天 20:00 ET 的公告队列。遇到节假日、moderation 或技术问题, 可能会延迟。

注意一个细节: arXiv identifier 不是你点提交那一秒生成的, 而是在论文公告时分配。不要还没公告就到处问 "我的 arXiv ID 怎么还没有", 这就像饭还在锅里, 你已经开始点评摆盘了。

版本、修改和撤回

如果论文公开前发现问题, 可以 Unsubmit, 修改后重新提交。公开前的修改不会生成新版本。

如果论文已经公开, 后续修订应提交 replacement, 不要开一个新 submission。arXiv 的版本号会变成 v2、v3。这个机制挺好, 像 Git 里的 commit history, 读者能看到研究如何演进。

但也正因为它是长期学术记录, 不要把 arXiv 当草稿箱。提交前至少做一次像样的自检:

  • 标题是否清楚
  • 摘要是否说明问题、方法、结果和意义
  • 作者顺序是否确认
  • 图表是否完整
  • 参考文献是否可追踪
  • PDF 是否从第一页到最后一页都正常
  • license 是否和期刊、基金、单位要求一致

一个可直接照抄的发布清单

下面这张清单, 建议在提交前逐项打勾。

检查项 要问自己的问题
研究贡献 这篇论文是否有清楚的问题、方法、结果和结论?
学科范围 它是否属于 arXiv 当前服务的领域和分类?
作者授权 所有作者是否同意提交版本、作者顺序和 license?
出版政策 目标期刊/会议/基金是否允许该版本公开?
文件准备 LaTeX 源码、图片、参考文献、宏文件是否齐全?
PDF 预览 arXiv 生成的 PDF 是否逐页检查过?
元数据 title、authors、abstract、category 是否准确?
背书 新用户或新分类是否已准备好找合适 endorser?
长期影响 这份公开记录是否经得起半年后的自己回看?

最后一句不中听但有用的话

把论文发到 arXiv, 技术上不难。真正难的是判断: 这篇论文是否已经成熟到值得公开。

公开是一种加速器。好论文会因此更快遇到读者、合作者和引用; 半成品也会更快暴露问题。咱们写代码时常说 "不要在生产环境调试人生", 写论文也差不多。提交前多花一天做清理, 可能比提交后花一周解释错误更划算。

如果你的 thesis 已经写完, 我的建议是: 先别急着上传整本。拿出其中最强的一章, 改成一篇干净、完整、可读的 paper。能讲清楚问题, 能站住方法, 能让同行看完愿意继续追问, 这就够了。

学术传播, 无他, 认真准备, 及时公开, 接受检验。

References


本作品采用知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议进行许可。