如何把你的论文发布到 arXiv
Posted on 六 25 4月 2026 in Tech
| Abstract | 如何把你的论文发布到 arXiv |
|---|---|
| Authors | Walter Fan |
| Category | Tech |
| Version | v1.0 |
| Updated | 2026-04-25 |
| License | CC-BY-NC-ND 4.0 |
论文写完那一刻, 很多人会有一种错觉: 大功告成, 世界只差一个链接就能看到我的智慧结晶了。
现实通常没这么浪漫。投稿期刊要等, 会议审稿要等, 学校归档也要等。科研这事有时像排队打饭, 菜都做好了, 窗口还没开。于是 arXiv 这种预印本平台就变得很有用: 先把研究成果公开出来, 让同行能读到、引用、讨论, 同时保留一个清晰的时间戳。
不过先把话说在前头: arXiv 不是学位论文仓库, 也不是帮你盖章毕业的地方。它更像一个严肃的科研预印本集市。你可以把 thesis 改写成符合学术交流习惯的 paper/preprint 发上去, 也可以提交符合 arXiv 学科范围和格式要求的研究稿件, 但不要把它当作学校论文系统或期刊审稿系统的替代品。
arXiv 是什么
arXiv 是一个开放访问的科研论文分享平台, 1991 年由 Paul Ginsparg 创建。按 arXiv 官方介绍, 它现在覆盖八大领域: physics, mathematics, computer science, quantitative biology, quantitative finance, statistics, electrical engineering and systems science, economics。
它的核心价值很简单:
- 让研究成果更快被看到
- 给论文一个稳定的公开页面和 arXiv identifier
- 支持检索、订阅、API、批量数据访问
- 为 TeX/LaTeX 论文提供编译和展示服务
- 由志愿 moderator 做学科相关性和基本学术质量把关
这里有个容易误解的点: arXiv 有 moderation, 但不是 peer review。moderator 会看稿件是否属于相关学科、是否有学术价值、格式是否靠谱、是否有明显抄袭或非科学内容, 但它不会像期刊审稿人那样给你三页意见, 顺便把你脆弱的自尊心按在地上摩擦。
一句话: arXiv 解决的是 "快速公开和长期保存", 不解决 "同行评审和学位认证"。
什么论文适合发
适合发到 arXiv 的, 通常是有明确研究贡献的稿件:
- 已完成但尚未正式发表的 preprint
- 已投稿会议或期刊、但不违反出版方政策的版本
- 已发表论文的允许归档版本, 例如 accepted manuscript
- 从学位论文中整理出来的一篇或几篇研究论文
- 有完整问题、方法、实验、结论和参考文献的技术报告
不太适合的内容也要心里有数:
- 课程作业
- 研究计划书
- 新闻评论或观点杂文
- 没有实质研究内容的介绍文
- 大段个人宣言、政治表达或营销材料
- 尚未和导师、合作者、单位确认权利归属的稿件
尤其是学位论文。博士论文、硕士论文往往篇幅很长, 有大量背景、综述、致谢、附录和学校格式要求。直接把整本 thesis 扔上去, 未必是最好的传播方式。更常见也更稳妥的做法是: 拆出其中最成熟的一章或几章, 按论文结构改写成一篇 research article。
提交前先过四道门
1. 权利和时机
先确认你有权提交。
如果论文包含合作者贡献, 要和所有作者确认。若涉及学校、公司、基金、专利或保密协议, 也要先问清楚。做研究不能像写临时代码, 今天 push, 明天再说。论文一旦公开, 时间戳很漂亮, 但有些门也就关上了。
还要检查目标期刊或会议的 preprint 政策。有些出版方允许预印本, 有些对 license、版本、embargo 有要求。arXiv 官方也提醒作者, license 选择不可撤销, 不同 funder 和 journal 的要求可能不同。
2. 账号和背书
你需要注册 arXiv 账号。注册时要填写姓名、机构、机构邮箱等信息; 如果没有机构, 可以填写 Independent。新用户或者第一次向某个分类提交时, 可能需要 endorsement。
endorsement 不是什么神秘仪式, 更像科研社区的入场检查。arXiv 希望确认提交者属于相应学术社区。最自然的背书人通常是导师、同领域教授、合作者, 或者在该领域已经活跃发表过 arXiv 论文的研究者。
这里不要群发骚扰邮件。科研圈不大, 邮件写得像海投简历, 很容易把路走窄。
3. 稿件格式
arXiv 接受多种格式, 但官方明确偏好 TeX/LaTeX。原因也不复杂: 源文件更适合长期保存、重新编译、生成可访问的版本。
如果你的论文本来就是 LaTeX 写的, 不要只上传编译后的 PDF。arXiv 通常希望你提交源文件, 包括:
- 主
.tex文件 - 被
\input或\include引用的章节文件 - 图片文件
.bib或.bbl参考文献文件- 自定义
.sty或宏文件, 如果确实需要
打包时可以用 .zip 或 .tar.gz。文件名尽量朴素, 不要带空格、中文、奇怪符号。咱们平时写代码都知道, 路径和大小写问题最烦人; 到论文提交系统里, 它照样烦人。
如果你的稿件来自 Word 或 Google Docs, 可以提交 PDF, 但要确保 PDF 是机器可读的、字体嵌入完整、图文在同一个 PDF 中。不要提交扫描版。扫描版看着像论文, 本质上是论文的照片, 系统和读者都不太高兴。
4. 元数据
提交时要填写 title、authors、abstract、category 等信息。arXiv 的元数据字段对字符有要求, 常见坑是从 PDF 复制出来的弯引号、长破折号、连字和 Unicode 字符。官方建议很朴素: 如果搞不定, 就手打。
category 要认真选。比如计算机领域里, cs.LG 是 machine learning, cs.CR 是 cryptography and security, cs.DC 是 distributed computing, cs.SE 是 software engineering。选错分类不是大罪, moderator 可能会帮你调整, 但这会增加延迟, 也说明你没有认真给自己的论文找读者。
提交流程
实际操作可以按这个顺序走:
- 注册账号, 完成邮箱验证。
- 从用户页面点击
START NEW SUBMISSION。 - 选择学科分类。
- 如果系统要求 endorsement, 按邮件提示找合适背书人。
- 上传源文件或 PDF。
- 点击
Check Files, 让系统识别编译器和顶层 TeX 文件。 - 检查编译日志, 预览 arXiv 生成的 PDF。
- 填写 title、authors、abstract、comments、category、DOI 等元数据。
- 选择 license, 并确认自己有权授予该 license。
- 最后提交, 等待 moderation 和公告。
arXiv 的公告有固定节奏。官方说明里, 一般在美国东部时间周日至周四公开新提交, 周五和周六没有公告; 14:00 ET 前完成最终提交, 通常会进入当天 20:00 ET 的公告队列。遇到节假日、moderation 或技术问题, 可能会延迟。
注意一个细节: arXiv identifier 不是你点提交那一秒生成的, 而是在论文公告时分配。不要还没公告就到处问 "我的 arXiv ID 怎么还没有", 这就像饭还在锅里, 你已经开始点评摆盘了。
版本、修改和撤回
如果论文公开前发现问题, 可以 Unsubmit, 修改后重新提交。公开前的修改不会生成新版本。
如果论文已经公开, 后续修订应提交 replacement, 不要开一个新 submission。arXiv 的版本号会变成 v2、v3。这个机制挺好, 像 Git 里的 commit history, 读者能看到研究如何演进。
但也正因为它是长期学术记录, 不要把 arXiv 当草稿箱。提交前至少做一次像样的自检:
- 标题是否清楚
- 摘要是否说明问题、方法、结果和意义
- 作者顺序是否确认
- 图表是否完整
- 参考文献是否可追踪
- PDF 是否从第一页到最后一页都正常
- license 是否和期刊、基金、单位要求一致
一个可直接照抄的发布清单
下面这张清单, 建议在提交前逐项打勾。
| 检查项 | 要问自己的问题 |
|---|---|
| 研究贡献 | 这篇论文是否有清楚的问题、方法、结果和结论? |
| 学科范围 | 它是否属于 arXiv 当前服务的领域和分类? |
| 作者授权 | 所有作者是否同意提交版本、作者顺序和 license? |
| 出版政策 | 目标期刊/会议/基金是否允许该版本公开? |
| 文件准备 | LaTeX 源码、图片、参考文献、宏文件是否齐全? |
| PDF 预览 | arXiv 生成的 PDF 是否逐页检查过? |
| 元数据 | title、authors、abstract、category 是否准确? |
| 背书 | 新用户或新分类是否已准备好找合适 endorser? |
| 长期影响 | 这份公开记录是否经得起半年后的自己回看? |
最后一句不中听但有用的话
把论文发到 arXiv, 技术上不难。真正难的是判断: 这篇论文是否已经成熟到值得公开。
公开是一种加速器。好论文会因此更快遇到读者、合作者和引用; 半成品也会更快暴露问题。咱们写代码时常说 "不要在生产环境调试人生", 写论文也差不多。提交前多花一天做清理, 可能比提交后花一周解释错误更划算。
如果你的 thesis 已经写完, 我的建议是: 先别急着上传整本。拿出其中最强的一章, 改成一篇干净、完整、可读的 paper。能讲清楚问题, 能站住方法, 能让同行看完愿意继续追问, 这就够了。
学术传播, 无他, 认真准备, 及时公开, 接受检验。
References
- About arXiv
- Submission Guidelines
- Submit TeX/LaTeX
- Submit a PDF
- Endorsement
- Licenses
- Content Moderation
- Availability of submissions
- Category Taxonomy
本作品采用知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议进行许可。