家里12楼,总觉得桌面浮尘多、加上猫猫到处飘,在和朋友聊天后决定买个小米空气净化器Pro H。一回来我就兴奋的插电开机,显数PM2.5在20左右,我觉得这也太低了吧?就去问客服,是不是得撕了滤芯膜再试?撕了能不能退?他只回复了我要撕了才会显数准,没回复我撕了能不能退。

我撕了以后再看,数据上去了个位数,随后很快降低到20左右。我觉得我上当了。。。

- 阅读剩余部分 -

今天晚上睡觉刚醒在刷X,看到王川发的:

Andy grove 曾说:“只有妄想狂才能生存。”
巴菲特曾说:“股市是一个把钱从不耐心的人转移到耐心的人的地方。”
德川家康说:“忍耐的尽头是不朽。”
我总结下来就是:妄想狂努力奋斗创造财富,但因为性急而持续不定期的把财富转移给更耐心的人,世界最终属于最能忍耐的人。

非常呼应和符合我现时的心境。我突然间想起事情。

- 阅读剩余部分 -

这两个月非常的焦虑,尤其这个月,睡的非常不好,断断续续、日夜颠倒。看似忙碌,实际工作效率非常的低下,错误频出,而且是非常低级的错误。因为没有好的睡眠和作息,记忆力、健康也下降的厉害。

一切伊始是业务增长保持在了我的预期,其实某种程度是超出我预期的,这增长了我的“全能感”,认为一切都可以在预期进行。于是为了保持快速增长,开始用贷款进行扩张,本质上这也算是杠杆吧!当然,我是储备有贷款相等现金的,为预防万一,但这是我一半以上的家当了,因其具有不确定性、不可否认这里面有赌的一些成分,所以我时常担心事情进展不如预期。

- 阅读剩余部分 -

我现在尽量让我的生活和工作保持在一个很慢的节奏,这样才有足够多的时间休息、看书、思考、保持心态的松弛,因为逐渐发现越发的追赶反而犯错的概率更大,就像买股票时候的追涨杀跌、关注短期收益反而最容易亏损。

但有时候不可避免的会因为某些事情会让内心非常浮躁、烦闷,对我自己最好的办法是马上放下工作或其他手头上的事情,除非停工就会立即对客户带来损失,否则立即投身到大自然中,去骑行、散步、看看山、看看水,会使浮躁的情绪很快冷却,有时候在路上突然就灵感迸发、让我烦闷的事情就突然想开了。

遇到下雨之类天气不好的时候,我发现做做运动,比如趴下做几组俯卧撑、深蹲,然后练练字也能达到类似的效果,十几块好几本行楷的临摹本,如果像我一样只是偶尔烦闷时候平复情绪,够写两三个月,还能让写的字更漂亮!虽然现在做互联网行业几乎很少场合需要写字,最多签个名字,但如果有这样的机会,漂亮的字会让人眼前一亮,比如我就很佩服、喜欢字漂亮的人。

Proxmox+VE用于公有云、VPS的可靠性得到了很多同行长期的验证认可,整个生态环境也满足我的需求,所需功能也基本都能满足,所以我开始用PVE了。我考虑用本地存储,如果是用智简魔方的公有云平台,一般情况只有硬卡RAID10是最好方案;但PVE出现了多个方案,我挑了几个,但很犹豫哪个最合适我:ZFS-RAID-Z2、ZFS-RAID-Z3、ZFS-RAID10,以及硬卡RAID10。

- 阅读剩余部分 -

今天遇到一个很狗血的问题…有1台华为S6720-32X-LI-32S-AC万兆交换机,设备只跑了100Mbps左右,但交换机的统计却显示跑了7-8%,也就是800Mbps左右。

输入 dis mac-address 检查发现没有学习到任何mac地址,判断可能是流量泛洪。

MAC地址转发时,采用相同的HASH算法去查找对应的VLAN+MAC表项,如果无法找到对应的表项,则产生流量泛洪。

- 阅读剩余部分 -

基于mysubmail接口发送短信、电话语音通知。创建脚本后可以通过crontab -e每小时或半小时运行一次,例如:
/30 * python /etc/weed/checkRAID.py
可以在raid出现异常状态时快速获知及时处理,避免故障扩大。

# -*- coding: utf-8 -*-
#!/usr/bin/python
import os
import requests

node = '香港vps-nvmenode-1'
error = 0

def get_status(value):
    try:
        status = value.split(": ")
        return status[1].strip()
    except:
        return False
    

def send_warning():
    global node

    # 语音通知
    voice_url = 'http://api.mysubmail.com/voice/send.json'
    voice_params = { 'appid': '*****',
                      'to': '13200000000',
                      'content': '紧急事态:'+node+'硬盘状态异常,请立即检查',
                      'signature': '**************'
                   }
    #voice_res = requests.post(voice_url, data=voice_params)
    # print voice_res.text

    # 短信通知
    message_url = 'http://api.mysubmail.com/message/send.json'
    message_params = { 'appid': '*****',
                       'to': '13200000000',
                       'content': '【XXX】紧急事态:'+node+'硬盘状态异常,请立即检查',
                       'signature': '**************'
                     }
    message_res = requests.post(message_url, data=message_params)
    # print(message_res.text)


# 检查RAID状态,注意/dev/md10是变动参数,自行fdisk -l查看你的软列阵磁盘名称,如raid1则为/dev/md1
raidinfos = os.popen('mdadm -D /dev/md10').readlines()
for raidinfo in raidinfos:
    raidinfo = raidinfo.strip('\n')
    print(raidinfo)

    if "State : " in raidinfo:
        status = get_status(raidinfo)
        if status != 'active' and status != 'active, checking':
            error = 1

    if "Failed Devices : " in raidinfo:
        status = get_status(raidinfo)
        if status != '0':
            error = 1

    if "Active Devices : " in raidinfo:
        status = get_status(raidinfo)
        if status != '2':
            error = 1

# 发送通知
if error == 1:
    send_warning()

如果RAID0用作CEPH OSD,则建议禁用磁盘级的缓存,也就是磁盘标签上写的那个256MB缓存:

# /opt/MegaRAID/MegaCli/MegaCli64 -LDSetProp -DisDskCache -Immediate -Lall -aAll
                                     
Set Disk Cache Policy to Disabled on Adapter 0, VD 0 (target id: 0) success
Set Disk Cache Policy to Disabled on Adapter 0, VD 1 (target id: 1) success
Set Disk Cache Policy to Disabled on Adapter 0, VD 2 (target id: 2) success
Set Disk Cache Policy to Disabled on Adapter 0, VD 4 (target id: 4) success
Set Disk Cache Policy to Disabled on Adapter 0, VD 5 (target id: 5) success
Set Disk Cache Policy to Disabled on Adapter 0, VD 7 (target id: 7) success
Set Disk Cache Policy to Disabled on Adapter 0, VD 8 (target id: 8) success

- 阅读剩余部分 -

我的CEPH OSD因为列阵卡不支持直通是基于RAID0的,最近ceph性能不足,排查过程iostat观察发现有一些盘r_await或w_await持续1000多,这就需要换盘了。ceph存储一份数据如果是默认3副本,那么就会3份副本写完才会完成写入,如果有1个osd延迟很高,就会影响整体写入速度。

首先可以运行 ceph-volume lvm list 查看osd对应的盘符,如果是bcache,则需要再运行lsblk查看在哪个盘符下。然后查看是哪个盘符,以及盘位,进行更换重建。

- 阅读剩余部分 -