background picture of the home page

HachiMiTa

SkillMimic v1&v2

一、 引言:让机器人像人一样学习交互 今天我们来探讨两篇来自港科和宇树的的论文:SkillMimic 和它的进阶版 SkillMimic V2。由于笔者并非RL背景出身,RL几乎是零基础,现在我们就从一个有深度学习基础但是从来没有RL与人机交互基础的视角来讲一下这两篇文章。 我们现在的目标是希望教会


ASC25 决赛回忆

前言 这两天也是刚刚打完ASC25的决赛回来,在走上颁奖台的那一刻(悬着的心也是终于死掉了),我本科的超算生涯也可以算是落幕了。虽然最终整体的结果不太好,但是对于我个人来说也是差强人意了😶‍🌫️。在比赛的过程中我接触到了来自各个顶尖高校的选手,与他们的交流和对话让我收获颇丰;这让我重新审视自己的


Distributed-llama 源码分析

Distributed Llama 作为github上的一个明星项目,有2.6kstar,可以在8台树莓派上面跑起来一个Llama3-405B参数的模型。截至今天(2025/4/02)我都没有看到中文互联网上有人写过它的源码分析,我很难过(其实是我打ASC希望学这个来打好我分布式代码的底层基础),今


ASC25 初赛回忆

ASC25初赛结果在不久前公布了,我们很幸运地进入到了决赛,回想过去的几天我仍然在为我们的成果完成度和最终加速比感到忐忑。在邻近公布结果的几天里,我一直紧张焦虑地睡不着觉,毕竟这可以说是我整个大学生涯中为数不多拼尽全力去争取的东西,如果最终迎来的是失败, 那我在老师和同学面前就要无地自容了😭QAQ


拓扑感知的阶层分子图扩散生成模型(THGD) --我的第一项独立科研工作

这篇工作前几天也是刚刚卡在deadline投去ECML了,作为我的第一篇相对独立的工作,从idea到实验到论文初稿都是我独立完成的,道路可以说是相当崎岖了,尤其是在缺乏指导的情况下走了相当之多的弯路(详见后记)。不过还好在最后的阶段碰到了马老师(人很好,非常感谢老师的指导),也是赶在ddl前完成了一


Alphafold3 分析其一

了解框架 知乎 AlphaFold3 源代码学习(二):关于技术原理的个人理解 - 我命油我不油天的文章 - 知乎 [The Illustrated AlphaFold] 初步理解 赛题要求加速推理


计网期末复习

计算机网络期末复习笔记,主要内容为王道考研PPT以及课本 重点 Review 物理层 传输介质分类: 有线介质: 光介质: 光纤 电介质: 同轴电缆


C MNIST 神经网络

我的唐氏专业在大三才开始教C,并且这门课没有布置任何相关的项目作业,为了加深对c的理解与印象,我打算用C写一个MNIST的项目,该项目涵盖所有的C知识点. 项目要求 涵盖知识点包括 数据类型的定义与转义, 字符串的处理以及相关函数的使用, 运算符与表达式的使用,


C 笔记

书《C Primer Plus》 的一些学习笔记 Chap.8 scanf会把换行符留在缓冲区中而getchar不会跳过换行符, 如下,while循环跳过了scanf后面的所有字符 if (scanf("%d, %d"&rows,&cols)!=2) break; display(ch,rows,c


Torch 分布式 torch.distributed (MPI)学习入门

在有多个GPU设备或者多个结点的时候我们通常希望充分利用这些计算资源来加速我们的训练/推理,torch官方提供了非常方便易用的API接口来让我们快速进行数据并行/张量并行: 但是有时候我们往往会希望对模型有更精确的控制,今天我们来基于torch的三篇官方教程 (Distributed communi