概述
wordcb是一款用于生成Microsoft Word格式代码本的Stata社区命令,它能够将数据集的变量信息(如标签、取值范围、缺失值等)导出为结构清晰、排版规范的Word文档,输出内容与Stata内置codebook命令高度相似。
依赖
Stata 15.1 及以上
安装
ssc install wordcb, replace
示例
wordcb using "codebook", append wordcb using "codebook.docx", replace
wordcb命令依托Stata 15引入的putdocx功能,将内存中数据集的元数据(文件名、标签、注释等)与各变量的结构化信息(变量名、类型、标签、格式、唯一值数、缺失值统计、变量注释)整合生成规范的Microsoft Word代码本文档,并为指定变量自动附加频数分布表(默认显示5个随机值,可通过values(#)灵活控制;设为0则省略具体值及描述统计量),支持通过sortfreq(按频数降序)或sortvalues(按值升序)定制排序逻辑,专为科研数据归档、文档标准化与团队协作设计。
需注意:该命令受Stata Java内存分配限制,处理变量过多、取值庞大或追加复杂文档时易触发堆内存错误;若需对不同变量设置差异化values(#)参数,须分多次调用(后续运行启用nodta与append选项),最终在Word中手动合并结果。
作者
姓名:xingTroy Payne
机构:Alaska Justice Information Center and University of Alaska Anchorage
邮箱:tpayne9@alaska.edu