京东面试题目1

pepper 2026-04-06

interview

业务&技术面试全流程应答（放贷业务场景）

结合放贷业务核心场景（风控审核、合同解析、数据流转、并发交易），针对技术面试高频问题逐一给出结构化、可直接复用的应答，兼顾业务落地性与技术深度，适配技术岗（后端/算法/架构）面试场景。

一、业务与个人介绍

1. 业务介绍（放贷业务）

我参与的放贷业务核心是全流程线上化信贷服务，覆盖用户准入、资质审核、合同生成、放款执行、贷后监控五大核心环节，支撑个人消费贷、小微企业经营贷两类产品。业务核心目标是平衡放款效率与风险控制：通过技术手段将传统人工审核的T+1流程压缩至分钟级，同时依托AI与数据治理将不良率控制在行业合理区间；技术侧需解决高并发交易（峰值每秒千级放款请求）、海量合同解析（日均百万份）、跨系统数据一致性三大核心问题，保障业务合规、高效、安全运行。

2. 自我介绍（适配技术岗+放贷业务）

面试官好，我是XX，核心技术栈覆盖AI大模型应用（GraphRAG、YOLO系列、TensorRT部署）、后端开发（Java/Python、MySQL、Redis、ES、Linux运维）、并发与分布式技术，同时熟悉放贷业务全流程，主导过合同智能解析、风控数据流转、高并发放款系统三大核心项目。其中合同解析项目是我核心负责模块，从文档分块设计、模型选型优化到准确率提升、高可用架构搭建全流程参与，最终将解析准确率从85%提升至98.2%，支撑日均百万份合同的智能审核；同时在高并发场景中，通过RedisStream替代传统消息队列、优化线程并发模型，保障了峰值下系统零宕机。我擅长将技术能力与业务场景结合，既懂底层技术原理（如AQS、MVCC、RPC序列化），又能落地解决实际业务问题，非常契合贵司放贷业务的技术需求，也希望能在面试中进一步交流。

二、实习项目应答（放贷业务-合同智能解析项目）

1. 项目大体内容

实习期间核心参与放贷业务合同智能解析项目，目标是替代人工完成信贷合同的关键信息提取（借款人信息、借款金额、利率、还款期限、担保条款等），直接对接风控审核系统与放款执行系统，解决人工解析效率低、易出错、成本高的问题。项目整体流程：对接业务方获取原始合同（PDF/Word/扫描件）→ 文档预处理（去噪、格式标准化、OCR识别扫描件）→ 分块处理与特征提取→ 大模型解析与信息抽取→ 结果校验与入库→ 对接风控与放款系统。最终实现效果：单份合同解析耗时≤2秒，准确率达98.2%，日均处理百万份合同，覆盖95%以上的信贷合同类型，直接替代80%的人工解析岗位，年节省成本超XX万元。

2. 项目使用的核心模型

基础文档解析模型：使用LayoutLMv3（多模态预训练模型），负责合同的版式识别、区域划分（如借款人信息区、金额条款区、签章区），解决复杂版式合同的结构化问题；
信息抽取核心模型：基于Llama 3（7B参数） 进行微调，针对放贷合同专属术语（如“年化综合利率”“连带保证责任”）进行领域适配，提升专业信息抽取准确率；
后处理校验模型：轻量BERT模型，用于校验抽取结果的逻辑一致性（如借款金额与大写金额是否匹配、还款期限是否符合监管要求），避免单一模型的解析误差；
部署优化模型：使用TensorRT对Llama 3与LayoutLMv3进行量化部署（INT8量化），在保证准确率下降≤0.5%的前提下，推理速度提升3倍，内存占用降低40%，满足高并发场景需求。

3. 文档分块方式与分块原因

（1）文档分块方式

结合放贷合同的业务逻辑与版式特征，采用“按语义分块+按版式分块结合”的方式，具体分3层：

一级分块（按业务模块）：将合同划分为【基础信息块】（借款人、出借人、合同编号、签订日期）、【核心条款块】（借款金额、利率、还款方式、期限）、【担保条款块】（抵押/保证信息、担保范围）、【违约责任块】、【争议解决块】、【签章块】6个核心模块；
二级分块（按语义段落）：每个核心模块内，按语义完整度拆分为独立段落（如“借款金额”块拆分为“小写金额”“大写金额”“金额说明”3个语义段）；
三级分块（按版式特征）：针对扫描件/非标准化合同，通过LayoutLMv3识别版式元素（标题、正文、表格、签章），将每个版式元素作为最小分块，确保复杂版式下的信息不遗漏。

（2）分块核心原因

降低模型解析复杂度：放贷合同篇幅长（平均5-10页），直接整体输入模型会导致上下文溢出、推理效率极低，分块后单块输入长度控制在512-1024token，大幅提升推理速度；
提升信息抽取精准度：不同业务模块的信息特征差异大（如基础信息块是短文本、核心条款块是数值+文本组合），分块后可针对不同块类型匹配专属解析策略，避免跨模块信息干扰；
便于结果校验与纠错：分块后每个语义块的解析结果可独立校验（如金额块需满足数值逻辑、条款块需符合监管规则），某一块解析错误时可精准定位并重新解析，无需整体返工；
适配业务规则落地：放贷业务有明确的监管要求（如利率需标注“年化综合利率”、担保条款需明确范围），分块后可将监管规则嵌入对应块的解析流程，确保抽取结果合规；
支持高并发批量处理：分块后可将合同拆分为多个子任务并行处理，结合分布式任务调度，提升百万级合同的处理效率，满足业务峰值需求。

4. 准确率提升至98%的方法与提示词设计

（1）准确率提升核心方法（分4阶段落地）

数据层：领域数据微调与增强
- 收集10万份真实放贷合同（覆盖不同产品、版式、年代），标注15类核心信息字段，对Llama 3进行全参数微调（学习率2e-5，迭代10轮），让模型掌握合同专属术语与语义逻辑；
- 数据增强：通过同义词替换、句式改写、版式模拟（如调整表格位置、修改字体）生成5万份增强数据，提升模型对复杂场景的鲁棒性；
- 引入监管规则数据（如银保监会信贷合同规范），构建规则库，作为模型解析的“硬约束”。
模型层：多模型协同与部署优化
- 采用“LayoutLMv3（版式识别）+ Llama 3（语义抽取）+ BERT（逻辑校验）”三级架构，避免单一模型的局限性；
- 对Llama 3进行LoRA微调（低秩适配，参数效率提升10倍），同时结合RAG技术，将合同相关的行业规范、监管规则构建成向量库，解析时动态检索相关知识，补充模型上下文；
- 使用TensorRT进行INT8量化部署，ONNX Runtime进行推理加速，保证高并发下模型推理的稳定性，避免因性能问题导致的解析错误。
流程层：分块策略优化与人工校验闭环
- 基于解析错误案例，迭代优化分块规则（如将易混淆的“利率”与“手续费”块拆分更细致），累计优化12版分块策略；
- 建立“AI解析+人工复核”闭环：对解析置信度≥0.98的结果直接入库，置信度＜0.98的自动推送人工复核，同时将人工纠错结果回灌到模型训练数据，形成迭代优化；
- 引入规则引擎，对关键字段（如利率、金额）进行硬校验，不符合监管规则的结果直接拦截，避免错误放款。
监控层：实时监控与迭代
- 搭建解析准确率实时监控平台，按合同类型、版式、业务模块统计准确率，发现异常（如某类合同准确率骤降）及时触发模型微调与分块策略优化；
- 每月复盘解析错误案例，形成错误分析报告，针对性优化模型与流程，累计解决23类典型错误场景。

（2）提示词设计（核心场景示例）

针对不同分块类型，设计结构化、强约束、分步骤的提示词，核心原则是“明确目标+限定格式+给出示例+补充规则”，以下为核心条款块的提示词设计：

# 角色
你是一名专业的信贷合同解析专家，精通中国银保监会信贷合同监管规则，擅长从合同文本中精准抽取核心条款信息。

# 任务
请从以下合同分块文本中，抽取【借款核心条款】的4类关键信息，严格按照指定格式输出，禁止遗漏、篡改信息。

# 分块文本


# 监管规则约束
1. 借款利率必须标注“年化综合利率”，禁止仅标注“月利率/日利率”，若未明确标注，需判定为“信息缺失”；
2. 借款金额需同时抽取“小写金额”与“大写金额”，两者必须一致，若不一致，需判定为“金额逻辑错误”；
3. 还款期限需明确“起始日期”“终止日期”“总期限（天/月/年）”，符合《贷款通则》相关要求；
4. 还款方式需明确“等额本息/等额本金/先息后本/一次性还本付息”，禁止模糊表述。

# 输出格式（JSON格式，严格遵守）
{
  "借款金额": {
    "小写金额": "抽取结果/信息缺失/金额逻辑错误",
    "大写金额": "抽取结果/信息缺失/金额逻辑错误",
    "金额说明": "抽取结果（如有）"
  },
  "年化综合利率": "抽取结果/信息缺失/利率违规",
  "还款期限": {
    "起始日期": "YYYY-MM-DD/信息缺失",
    "终止日期": "YYYY-MM-DD/信息缺失",
    "总期限": "X年/X月/X天/信息缺失"
  },
  "还款方式": "抽取结果/信息缺失/方式违规"
}

# 示例
输入分块文本：“借款人向出借人借款人民币壹佰万元整（小写：1000000.00元），借款年化综合利率为8.5%，借款期限自2026年01月01日至2027年01月01日，还款方式为等额本息，按月还款。”
输出JSON：
{
  "借款金额": {
    "小写金额": "1000000.00元",
    "大写金额": "壹佰万元整",
    "金额说明": "无"
  },
  "年化综合利率": "8.5%",
  "还款期限": {
    "起始日期": "2026-01-01",
    "终止日期": "2027-01-01",
    "总期限": "1年"
  },
  "还款方式": "等额本息"
}

提示词设计核心逻辑：

明确角色与任务，让模型聚焦目标；
嵌入监管规则，从源头保证合规性；
限定输出格式，便于系统直接解析与入库；
提供示例，降低模型理解成本，提升输出一致性；
针对易出错字段，明确“信息缺失/违规”的判定标准，减少模糊输出。

5. 为什么用RedisStream而非Kafka？消息队列区别

（1）选型核心原因

结合放贷业务高并发、低延迟、轻量级、数据量适中的特点，选择RedisStream替代Kafka，核心优势集中在4点：

部署与运维成本极低：Redis是业务现有中间件（已用于缓存、分布式锁），RedisStream无需额外部署独立集群，运维团队无需学习新组件，降低技术栈复杂度与运维成本；而Kafka需独立部署、维护集群，依赖ZooKeeper，学习与运维成本高，对中小规模业务冗余度过高。
延迟更低：RedisStream基于内存存储，消息读写延迟控制在1ms以内，满足放贷业务“放款请求分钟级响应”的核心需求；Kafka依赖磁盘存储，即使优化后延迟也在10ms以上，无法匹配业务低延迟要求。
数据规模适配：放贷业务消息峰值为“每秒千级”，单条消息大小≤10KB，RedisStream完全可承载；而Kafka适合“每秒十万级以上、单条消息大（MB级）”的海量数据场景，此处使用Kafka属于“大材小用”，资源浪费严重。
消费模式更灵活：RedisStream支持消费组+消息确认（ACK） 模式，与Kafka消费组逻辑一致，同时支持“Stream消费”“消费组广播”“历史消息回溯”，满足业务“多系统同步数据（风控、放款、贷后）”的需求；且RedisStream支持消息持久化（可配置RDB/AOF），兼顾性能与数据安全。

（2）RedisStream vs Kafka 核心区别（表格对比）

对比维度	RedisStream	Kafka	业务适配性
存储介质	内存为主，支持持久化	磁盘为主，页缓存加速	放贷业务（中小数据）：Redis延迟更低
部署运维复杂度	低（复用现有Redis集群）	高（独立集群、依赖ZooKeeper）	放贷业务：Redis降低运维成本
消息延迟	1ms以内	10ms以上	放贷业务（低延迟）：Redis更适配
消息吞吐量	万级/秒（单节点）	十万级/秒以上（集群）	放贷业务（千级/秒）：Redis足够
单条消息大小	建议≤10KB	支持MB级以上	放贷业务（小消息）：Redis更高效
消费模式	消费组+ACK+历史回溯	消费组+ACK+分区分配+偏移量管理	放贷业务：两者均满足，Redis更简单
生态集成	与Redis生态（缓存、分布式锁）无缝集成	独立生态，需对接多种组件	放贷业务：Redis减少系统耦合
适用场景	中小规模、低延迟、轻量级消息队列	海量数据、高吞吐、大数据分析场景	放贷业务：Redis是最优解

补充说明：若未来业务扩展至“日均千万级合同、单条消息大（如合同全文存储）、跨地域数据同步”，可考虑迁移至Kafka，目前阶段RedisStream是性价比与性能的最优平衡。

6. 成功率提升方法（放贷业务-高并发放款系统）

放贷业务的“成功率”核心指放款请求的成功响应率，需同时解决“并发冲突、数据不一致、系统异常”三大问题，具体提升方法分4个维度落地：

（1）架构层：优化消息队列与分布式事务

采用RedisStream+本地事务替代传统的“单库单表事务”，将放款请求（扣减额度、生成放款单、调用支付接口）拆分为异步任务，避免同步请求导致的系统阻塞；
引入Seata分布式事务框架，针对“跨库操作（额度库、放款单库、支付库）”场景，采用AT模式（自动事务），保证数据一致性，同时通过TCC模式（手动补偿）处理支付接口调用异常，提升事务成功率；
搭建多活容灾架构，将核心系统部署在2个可用区，当某一可用区故障时，自动切换流量，避免单点故障导致的放款失败。

（2）并发层：优化线程模型与锁机制

针对放款额度扣减的并发冲突问题，采用Redis分布式锁+分段锁替代传统的数据库锁：将额度按用户ID哈希分片，每个分片对应一个Redis锁，避免多用户并发扣减时的锁竞争，同时减少锁粒度，提升并发处理能力；
采用线程池优化：根据业务峰值（每秒千级请求）配置核心线程数200、最大线程数500，拒绝策略为“队列等待+超时重试”，避免线程溢出导致的系统崩溃；
引入CompletableFuture实现异步并行处理，将放款流程中的“额度校验”“用户信息查询”“风控复核”等非依赖步骤并行执行，单请求耗时从500ms压缩至150ms，提升系统吞吐量。

（3）流程层：优化异常处理与重试机制

搭建全链路异常监控：通过SkyWalking监控每个接口的响应时间、错误率，当某