跳到主要内容

实例空间

更新时间:2025-11-03 17:50:25

您可以通过实例空间快速启动GPU和CPU实例,下载模型或数据集,进行模型微调和数据处理。

前提条件

  • 您已经获取LLaMA-Factory Online账户和密码,如果需要帮助或尚未注册,可参考注册账户完成注册。
  • 当前账号的余额充裕,可满足模型微调服务的需要。点击可了解最新的活动费用信息,或前往充值,如需了解更多请联系我们
  • 平台为您提供了内置的模型和数据集,若您想使用自己的模型和数据集,可参考文件管理进行模型和数据集上传。自定义数据集处理部分可参考数据处理

概览

实例空间页面如下图所示。点击“开始微调”即可启动实例。

连接2

操作步骤

启动实例

  1. 登录账号后点击右上角“控制台”,进入控制台后点击左侧导航栏中的“实例空间”,点击“开始微调”启动实例。

    连接2

  2. 根据模型等参数选择对应版本的镜像,单击控制台图标,进入镜像选择页面,例如下图所示,单击“查看模型镜像列表”查看对应的镜像列表,例如下图高亮①所示,镜像选择完成后,单击“确定”按钮即可。

    控制台

    您也可以点击“筛选”链接,例如下图高亮②所示,根据cudatransformerspytorchLLaMAFactory版本筛选所需的镜像,各类组件的可能组合可参看查看模型镜像列表

  3. 用户注册后首次启动实例时,系统会自动推荐一个远程访问端口(例如:36458)供其使用,该端口可用于SSH等服务的连接。如果用户不想使用系统推荐的端口号,可以点击端口号的 “刷新”​ 按钮,系统将随机生成一个新的端口号。

    提示
    • 当用户关闭当前实例后,如果短期内再次启动实例,并且这个端口号没有被其他用户占用,那么系统保留原来的端口号。

    • 如果用户关闭实例后,间隔了很长时间没有启动实例,该端口号很可能被系统释放并分配给其他用户。此时,当用户再次启动时,那么系统就必须为他分配一个新的、未被占用的端口号。

  1. 如果用户选择GPU资源规格,待配置参数说明如下所示。
  • 资源规格:选择"H800A(显存80G)",该类型的资源适用于大模型训练、微调、推理等并行计算场景。
  • 卡数:选择待使用的GPU卡数,平台支持选择1卡2卡3卡4卡5卡6卡7卡8卡等卡数。
  • 付费方式:选择GPU卡的扣费方式,目前平台支持按量付费,即按照GPU的实际使用时长进行付费。
  • 优惠价格:平台提供H800A(80G显存)显卡算力服务的两种不同套餐,核心区别在于服务优先级和价格,以满足不同场景和预算的需求,详情如下所示。
    • 极速尊享​:提供高优先级保障、资源紧张时也不会中断实例的稳定服务。
    • ​灵动超省​:享受极高折扣、但资源紧张时可能被停止实例的低成本、可中断型服务,支持选择“实例停止前转极速尊享”。
提示

开启此模式后,当常规资源不足时,您的实例将自动升级至“极速尊享”模式继续运行,不会因资源问题而停止。此期间将按“极速尊享”的标准价格计费。

  1. 您可以根据需求进行“LLaMA-Factory快速微调模型”、“VSCode处理专属数据”,或“JupyterLab处理专属数据”。

    数据处理

重置资源

回到控制台,点击右上角资源重置按钮控制台可重置当前实例的资源,例如下图所示。

数据处理

SSH远程连接

回到控制台,点击右上角SSH远程连接按钮 控制台可获取该实例远程连接信息,例如下图所示,点击“SSH远程连接”链接可查看具体使用方法。

控制台

关闭实例

回到控制台,点击右上角按钮 reset1可关闭实例,例如下图所示。

数据处理

定时关机

点击右下角定时关机按钮(下图高亮①),打开定时关机开关(下图高亮②),选择关机时间(下图高亮③),点击确认(下图高亮④),即可定时关机。

数据处理