`

Ethical considerations when planning, implementing and releasing health economic model software: a new proposal

创建于 更新于

摘要

本报告针对健康经济模型软件(CHEMs)提出伦理考量框架,强调开发者应遵循社会可接受性、适用性和社会效益三大伦理目标,并提出透明(T)、可复用(R)和可更新(U)的六项具体评估标准,进而推动健康经济模型软件的开源发展和持续维护,从而减少伦理风险,提高模型质量与应用价值 [page::0][page::3][page::5][page::7][page::8]。

速读内容

  • 健康经济模型软件(CHEM)是一种实现健康经济模型结构、数据和算法的计算工具,其开发实现方式影响模型的验证和有效性 [page::1].

- 专有软件与开源编程语言各有利弊,专有软件使用门槛低,但限制复用与透明度;开源软件虽开发初期投入大,但促进透明、复用及维护,有利于伦理合规和模型持续更新。
  • 伦理目标分阶段设置:规划(社会可接受的用户需求与设计规范)、实施(适用性强的实现)和发布(具社会效益的使用),强调透明性贯穿始终 [page::3][page::4].

- 提出并阐释透明(T)、可复用(R)和可更新(U)(TRU)三大属性对伦理目标的支撑作用,以及每属性对应的具体评估标准(六条),详见表格:

| 属性 | 项目 | 评估标准 |
|------------|------|------------------------------------------------------------------------------------------|
| 透明 (T) | T1 | 软件文件(可执行代码、测试和非机密数据)公开可得 |
| | T2 | 明确开发者贡献及模型假设、判断,方便第三方识别和理解 |
| 可复用 (R) | R1 | 编程实践支持独立复用模型组件 |
| | R2 | 许可证允许任何人免费、合伦理地复用代码及数据,支持衍生作品 |
| 可更新 (U) | U1 | 具备维护基础设施,支持版本控制和协作 |
| | U2 | 每个新版本均系统性重新测试,尽量减少对现有用户的扰动 |

[page::7]
  • 目前多数健康经济模型软件不满足TRU标准,主要原因包括知识与资源不足、知识产权顾虑和维护成本高等;呼吁政府和资助方加大投入,促进培训、制定规范和搭建共享基础设施 [page::6][page::7].

- 推荐采用模块化设计、分离数据和代码,实现软件易维护与扩展;利用GitHub等平台促进协作开发、贡献透明化和自动化持续集成测试,提升模型质量与信任度 [page::5][page::6].
  • 伦理风险主要源于开发者与利益相关方价值观不匹配、模型验证和复现不足、概念与代码不一致等,强调需给潜在第三方用户提供充分评估工具与信息 [page::4][page::5].

- 强调开放源代码与共享的伦理意义:提高透明度、促进知识传播和模型改进,但需配合法律授权和社区共识,避免滥用和误用风险 [page::7].

深度阅读

深度分析报告:Ethical considerations when planning, implementing and releasing health economic model software: a new proposal



---

1. 元数据与报告概览



报告标题:
Ethical considerations when planning, implementing and releasing health economic model software: a new proposal

作者及机构:
  • Matthew P Hamilton(Monash University等多所澳洲机构联合署名)

- Caroline Gao
  • Jonathan Karnon

- Luis Salvador-Carulla
  • Sue M Cotton

- Cathrine Mihalopoulos

发布日期:
文章首页未直接展示具体发表时间,参考文献年份显示2024年相关出版。

研究主题:
本文聚焦于健康经济学模型软件(即计算健康经济模型,简称CHEM)的开发、实施与发布过程中的伦理考量。主题涵盖软件开发中的伦理原则、模型的透明性、可重用性和可更新性(TRU标准),以及相应的实践指南和评价标准。

核心论点:
作者指出,尽管健康经济分析高度依赖计算模型,然而对于模型作为软件实现时的伦理研究相对薄弱。提出开发和资助CHEM的团队应遵循伦理原则,确保:(i)用户需求和设计规范的社会可接受性;(ii)实现的适用性(fit for purpose);(iii)发布后的社会效益。

为推动此目标,提出了透明(Transparent)、可重用(Reusable)、可更新(Updatable)三大CHEM属性,并细化为六条具体评估标准(TRU标准体系)。现有许多模型难以满足全部标准,行业需要扶持与创新措施。作者旨在引发健康经济学界对于模型软件伦理的更深刻讨论。[page::0]

---

2. 逐节深度解读



2.1 摘要 (Abstract)



摘要明确指出CHEM开发中存在的伦理盲点,并引入TRU三个目标属性及对应评估标准:
  • (T1) 软件文件公共开放

- (T2) 明确开发贡献和使用判断
  • (R1) 编程实践促进独立重用

- (R2) 使用允许重用及派生工作许可的开源协议
  • (U1) 建立维护基础设施

- (U2) 系统性再测试和弃用策略

摘要强调现有多数学术或应用CHEM难以满足这些标准,需要更新行业指导和加强资金支持。[page::0]

2.2 引言 (Section 1)



作者解释健康经济学模型的三层表征:概念模型(文字图形)、数学模型(方程)、计算模型(软件)。报告表明,一般学界论文往往只隐式假设了三者内在一致,且计算模型的实现细节极大地影响模型的透明性和验证度。

CHEM可由专有软件(例如Excel)或开源语言(Python、R)实现。当前健康经济学培训对软件开发涵盖有限,但未来趋势(如“活”技术评估、机器学习、LLM辅助编程)迫使业界关注软件开发的伦理问题。

报道强调LLM的出现带来的新型伦理风险(安全隐患、许可限制、环境成本、可解释性等),以及WHO针对此类技术的伦理指导,呼吁健康经济学界积极回应软件开发中的伦理困境。[page::1]

2.3 软件平台比较 (表1)



表1比较专有软件与开源编程语言实现CHEM的利弊:
  • 专有软件优点:

- 含有成熟工具,普及度高,门槛低,执行稳定
  • 专有软件缺点:

- 购买许可费用高;手工结果转录导致报告错误风险;修改权限受限,难以跟踪变化
  • 开源软件优点:

- 公共开放源代码,易于识别贡献,促进模块复用,支持版本控制和持续集成
  • 开源软件缺点:

- 初期开发劳动强度大,依赖维护和兼容性,潜在代码错误检测难度高

此表帮助理解计划阶段用户需求和设计选择中的伦理考量,即如何权衡透明开放与资源消耗、社区支持、易用性等利益冲突。[page::2]

2.4 伦理目标与原则 (Section 2)



作者引入Resnik的18个伦理原则,挑选6个与CHEM软件实施高度相关:责任、保密、知识产权、开放、透明、社会责任。结合Boden和McKendrick的公共健康建模伦理框架,概括了三个软件开发关键阶段的伦理目标:
  • 计划阶段:用户需求和设计规范的社会可接受性

- 实施阶段:实现的适用性(fit for purpose),即模型应符合预期且正确
  • 发布阶段:社会受益,确保模型被恰当及持续使用


贯穿三阶段的是透明性和社会责任的要求。作者通过该框架指出,软件开发中的伦理考虑超越传统健康经济模型的数学和概念层面,扩展到软件生命周期全程。[page::3]

2.5 伦理风险与资源平衡 (Section 3 和相关讨论)



作者特别提及开发者的价值判断及其对模型设定的潜在影响,如选择专有或开源平台涉及不同的伦理风险和权衡。强调开发者不应单靠自我认证,而应提供第三方评估模型适用性的途径。指出当前诸如方法欠缺、验证不足、结果复现难、错误未披露等问题,强调计算实现的恰当设计能在一定程度上缓解这些风险。

项目后期维护不足会导致模型失效、滥用或过时,限制模型的社会价值和受益时间窗口。呼吁开发者与资助方共同承担责任,保障伦理目标不仅在愿景中,更在实践中实现。

作者同时现实地指出,经济学界现有激励结构并不鼓励模型开源与维护,维护工作往往依赖极端理想主义,需要制度和资金层面支持。[page::4]

2.6 TRU理念与属性 (Section 3、Table 2)



TRU三个属性(透明、可重用、可更新)是对伦理目标的具体化,它们体现:
  • 透明(Transparent): 实现代码和数据的公开可查,便于第三方审核模型假设和验证

- 可重用(Reusable): 结构模块化,方便模型改写和扩展,许可允许无障碍合法使用
  • 可更新(Updatable): 有维护机制,版本管理,持续验证以保持模型有效性


表2精炼地将TRU属性对应至伦理目标并描述其意义,强调这些属性减少伦理风险并促进模型适应多变的现实政策需求。[page::5]

2.7 编程实践与技术手段 (Section 4)



重点阐述软件工程良好实践对TRU达成的重要性:
  • 代码模块化,避免数据硬编码,方便替换细节

- 使用开源许可和合适授权协议
  • 维护体系建立,包括版本控制、社区协作、连续集成测试

- 采取弃用策略防止旧版本滥用

利用GitHub之类的在线平台支持透明贡献记录、用户反馈和协作开发,从技术层面保障模型生命力并降低维护成本。[page::6]

2.8 TRU评估指标 (Table 3)



明确分解评估CHEM的六个具体标准:
  • 透明性:

- T1:公共开放软件文件(代码、测试及非保密数据)
- T2:清晰展现资金、开发、测试团队及模型假设和判断
  • 可重用性:

- R1:编程促进独立复用组件
- R2:许可允许免费合法重用和派生
  • 可更新性:

- U1:维护基础设施支持版本控制和用户协作
- U2:每次发布均系统性再测试,减少用户破坏性影响

该标准体系封装了软件开发生命周期中的关键伦理实践,便于第三方客观评估。[page::7]

2.9 挑战与建议 (Section 5)



报告指出,当前大部分CHEM难以满足TRU标准,开源模式遭遇隐私保护、知识产权、资源维护、商业机密等多重障碍。
同时,行业缺乏完善的开源CHEM实践指导和培训,建议填补制度和人才培养上的空白。强调需要政府及研究基金机构加大基础设施和人力资本投入。

提倡建立统一平台、共识标准和模型共享机制,并加强合作网络,推动透明、共享、持续维护的研究软件生态体建设。[page::7]

2.10 结论 (Section 6)



总结本文主张:开发与资助团队宜将“社会可接受用户需求”、“适用实现”和“社会获益”作为CHEM三大伦理目标,以TRU性作为达成指标。提出六条评估标准,旨在引发健康经济学界开展关于模型软件伦理问题的系统讨论和改进措施。

此结论明确呼吁变革和投入,强调伦理考量在模型开发中的重要性。[page::8]

---

3. 图表深度解读



3.1 表1:专有软件 vs 开源语言的对比


  • 该表详尽列举了两类平台的资源需求、易用性、重用性、伦理性和更新的优劣。

- 专有软件优势在于使用便捷和执行稳定,缺陷是许可限制和变更追踪困难;开源软件开发门槛较高,但有助于透明度、协作及维护长期有效性。
  • 图表强调即使开源方案存在技术和资源挑战,从伦理角度看,能够促进价值判断体现和社会责任承担,是实现TRU的关键平台选择。

- 该表体现了模型设计阶段权衡的典型伦理冲突和可持续性问题,是文章论证软件伦理重要性的基础图示。[page::2]

3.2 表2:TRU属性对应伦理目标


  • 表格将TRU三属性与伦理“三目标”及具体含义关联起来,简练明了。

- 透明性促进第三方评析和决策者理解弱点;可重用性便于模型适应不同背景,发现潜在错误;可更新性延长模型生命周期。
  • 体现理论与实践目标的结合,是构建后续评价标准基础。

- 配合文本表明提升模型的伦理实践不仅是技术需求,更是社会责任体现。[page::5]

3.3 表3:TRU六评估标准


  • 具体化TRU属性的执行尺度,将抽象目标转化为可度量指标。

- 项目如公开代码、明确贡献、模块化编程、开源许可、维护基础设施、持续系统测试分别体现透明、重用、更新三个维度的关键环节。
  • 该指标体系为健康经济模型软件的伦理自检与监管提出了实操路径,便于推动行业标准化。

- 表3的提出标志着论文的理论框架迈向具体实施指导。[page::7]

---

4. 估值分析



报告主体不涉及金融估值模型、公司估值或具体财务数据预测,因此无估值分析部分。

---

5. 风险因素评估



报告识别的主要“风险”实为伦理风险和实践障碍,包括:
  • 价值观错配及透明度不足导致模型假设不可验证或产生误用风险。

- 如模型开发者与受影响群体价值偏离,可能导致社会不公或决策失误。
  • 软件使用专有平台增加访问门槛和修改难度,影响模型共享和持续更新。

- 维护资源不足引起模型快速失效,造成误导性应用。
  • 知识产权、商业秘密限制公开开放,阻碍社区合作与伦理透明度。


此外,环境成本、LLM辅助开发引入的安全隐患和许可限制也是新兴风险点。
报告强调上述风险需要通过透明开发、共享许可和维护支持来缓释,且责任在开发者与资助者共同承担。[page::3][page::4][page::7]

---

6. 批判性视角与细微差别


  • 报告以较为客观理性的语气陈述健康经济CHEM开发存在的伦理不足,未绝对批判而是用“伦理风险”作为措辞,体现了审慎和包容态度。

- 报告承认开源理念虽有理想但难以普及,展示现实操作层面的资源和动机缺口。
  • 文章术语和逻辑较为严谨,但对如何权衡专有与开源平台的深层矛盾较为保守,仅笼统建议权责共担,缺少具体的利益冲突解决方案。

- 未对LLM产生的伦理挑战给出专门对策,虽有提示,仍属于呼吁性讨论。
  • 文中对维护的“理想主义”依赖表现出对当前体系激励不足的隐晦批评,反映行业现状的复杂性。

- 可能的矛盾点在于,虽然推崇开放透明,但也承认商业保密需求限制了实际应用,提醒不能一味追求理想而忽视现实。[page::4][page::7]

---

7. 结论性综合



本文对健康经济学中的计算模型软件开发过程提出了一套全面的伦理框架,聚焦于软件实现的透明、可重用和可更新三大属性(TRU),并据此构建了六条具体评估指标,旨在确保模型的社会可接受性、适用性和持续社会效益。文章结构严谨,逻辑清晰,通过回顾现行健康经济模型开发的多个问题及软件开发理论,科学地揭示了当前实践中的伦理风险和行业挑战。

核心发现包括:
  • 当代健康经济模型软件普遍缺乏足够透明度和开放性,阻碍了模型验证、复用和长期维护。

- 选择使用专有软件或开源语言平台本身即包含伦理与实践的权衡,直接影响模型的开放性和价值传承。
  • 软件开发生命周期的三阶段(规划、实现、发布)均包含独特的伦理考量,必须被纳入健康经济建模实践。

- TRU三属性是衡量这一伦理实践的有效标尺,并以六条细化标准为行为指引,为行业提供可操作的参考框架。
  • 实际推广TRU标准受限于资金、人才、法律环境及商业动机,需政府和研究资助机构介入支持。

- 培训、指导文件和法律服务缺乏,影响模型开发者和使用者的能力构建和合规性。

表格分析强化了文本论点,特别是通过软件平台选择对比、TRU属性与伦理目标关联表和具体技术执行标准的呈现,使理论建议具备实践操作性。

综上,报告向健康经济学界发出呼吁:在数字化转型和AI技术推动下,应加强对模型软件开发伦理的系统关注,推动行业规范升级,建立开放共享且持续维护的模型生态,从而提升建模工作的社会价值和政策影响力。[page::0][page::2][page::5][page::7][page::8]

---

参考文献



详见原文页码9至11。

---

注:本分析严格基于提供文本内容,文中引用均附加相应页码以供追溯。

报告