PHP内核探索 —— 变量的存储
PHP中的变量类型和值是通过C语言实现的,内核具体是如何组织用户在PHP中定义的变量呢?
HashTable在ZE内核中被广泛使用,PHP变量也正是存储在一个HashTable实现的符号表里。当在PHP中调用一个函数或者类时,内核会创建一个新的符号表,这也是为什么在函数中无法使用函数外部定义的变量的原因。因为他们分属两个符号表,一个当前作用域,一个全局作用域。
现在来看内核中是如何定义作用域的:
struct _zend_executor_globals { //略 HashTable symbol_table;//全局变量的符号表 HashTable *active_symbol_table;//局部变量的符号表 //略 };
可以通过EG宏来访问变量符号表,EG(symbol_table)访问全局作用域的变量符号表,EG(active_symbol_table)访问当前作用域的变量符号表。
<?php $foo=’bar’; ?>
上面这段代码很简单,创建变量foo,并赋值bar。之后的PHP代码中就可以调用$foo变量了。现在看看PHP中定义的变量,内核中是如何实现的。伪代码:
zval* foo; MAKE_STD_ZVAL(foo); ZVAL_STRING(foo, 'bar', 1); ZEND_SET_SYMBOL( EG(active_symbol_table), 'foo', foo);第一步:创建一个zval结构,并设置类型。第二步:赋值为bar。第三步:将其加入当前作用域符号表,只有这样用户才能在PHP里使用这个变量。
通过简单的这三步,即可实现定义PHP变量。简单的原因,在于内核为我们提供了强大的宏。现在我们将宏分别展开。
MAKE_STD_ZVAL应用到的宏有:
#define MAKE_STD_ZVAL(zv) ALLOC_ZVAL(zv);INIT_PZVAL(zv) #define ALLOC_ZVAL(z) ZEND_FAST_ALLOC(z, zval, ZVAL_CACHE_LIST) #define ZEND_FAST_ALLOC(p, type, fc_type) (p) = (type *) emalloc(sizeof(type)) #define INIT_PZVAL(z) (z)->refcount__gc = 1;(z)->is_ref__gc = 0;
MAKE_STD_ZVAL(foo)展开后得到:
(foo) = (zval *) emalloc(sizeof(zval)); (foo)->refcount__gc = 1; (foo)->is_ref__gc = 0;
可以看出,MAKE_STD_ZVAL做了三件事:分配内存、初始化zval结构中的refcount、is_ref。
ZVAL_STRING应用到的宏有:
#define ZVAL_STRING(z, s, duplicate) { const char *__s=(s); Z_STRLEN_P(z) = strlen(__s); Z_STRVAL_P(z) = (duplicate?estrndup(__s, Z_STRLEN_P(z)):(char*)__s); Z_TYPE_P(z) = IS_STRING; } #define Z_STRLEN_P(zval_p) Z_STRLEN(*zval_p) #define Z_STRLEN(zval) (zval).value.str.len #define Z_STRVAL_P(zval_p) Z_STRVAL(*zval_p) #define Z_STRVAL(zval) (zval).value.str.val #define Z_TYPE_P(zval_p) Z_TYPE(*zval_p) #define Z_TYPE(zval) (zval).type #define IS_STRING 6
展开后得到:
const char *__s=('foo'); (foo).value.str.len=strlen(__s); (foo).value.str.val=(duplicate?estrndup(__s, (zval).value.str.len):(char*)__s); (foo).type=6;
ZVAL_STRING做的工作是设置数据类型并赋值。
ZEND_SET_SYMBOL这里只展开一部分宏,因为它展开后过于复杂。
# define EG(v) (executor_globals.v)
展开部分后得到:
ZEND_SET_SYMBOL(executor_globals.active_symbol_table, 'foo', foo);
将变量名入当前作用域符号表。之所以使用内核提供的宏来分配内存、注册变量作用域,是因为这样能提高兼容性。
相关文章: